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Avant-propos 


Cet ouvrage est le fruit de ma participation aux Jurys des Concours ainsi 
qu’à la préparation des candidats. 

Il propose aux candidats préparant le CAPES de Mathématiques un cours 
de Probabilités correspondant au programme de l’Écrit, ainsi que des exer- 
cices, tous corrigés, sur chaque chapitre. 

Il s'adresse également aux candidats à l’Agrégation Interne, dont le pro- 
gramme du concours comprend celui du CAPES et quelques points spé- 
cifiques (signalés comme tels) qui sont détaillés : fonctions génératrices, 
théorème de transfert pour une variable à densité, vecteurs à densité et loi 
forte des grands nombres. 

Le dernier chapitre est spécifiquement destiné aux candidats au CAPES : 
les leçons d’Oral du CAPES relatives aux dénombrements et aux proba- 
bilités sont traitées et commentées, ainsi que celle portant sur les séries 
statistiques doubles, qui fait l’objet d’un complément indispensable. 


Les Probabilités posent souvent des difficultés aux candidats car certains 
n’ont pas suivi de cours de Probabilités après le Lycée, tandis que beau- 
coup d’autres ont abordé cette discipline directement avec le point de vue 
de la théorie de la mesure. 

Le cours est traité conformément au programme, c’est-à-dire sans référence 
à la théorie de la mesure. Les outils utilisés (fonction l’, intégrale de Gauss, 
suites et séries, intégrales généralisées, algèbre bilinéaire.….) font l’objet 
à chaque occasion de rappels et de développements classiques, permet- 
tant ainsi aux candidats de réviser des points fondamentaux d’analyse et 
d’algèbre. 

Deux points hors programme m'ont semblé indispensables : la tribu des 
boréliens et les familles sommables ; ils sont traités en annexe. 


J'espère que ce livre permettra aux candidats d’aborder les Probabilités 
avec une base solide. 


Ce livre pourra également intéresser tout professeur ayant à enseigner les 
Probabilités au Lycée ou dans les deux premières années de l’Enseignement 
Supérieur. 


Les lecteurs qui le souhaitent peuvent me contacter à l’adresse suivante : 
jerome.escoffier@yahoo.fr ou s’adresser aux Editions Ellipses qui transmet- 
tront. 
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Chapitre I : Espaces probabilisés 


Les probabilités sont une branche des Mathématiques dont l’objet est 
l'étude des phénomènes aléatoires. Historiquement, il s'agissait essentiel- 
lement des jeux de hasard et des problèmes d'espérance de vie pour des 
calculs de rente. 

L'approche mathématique de ces problèmes n’apparaît réellement qu’au 
17€ siècle avec Pascal et Fermat, puis au siècle suivant avec Bayes et La- 
place. 

L'élaboration d’un cadre mathématique rigoureux est très récente et elle est 
due à Kolmogorov, qui a axiomatisé le calcul des probabilités (fondements 
du calcul des probabilités, 1933) et a permis en particulier l’utilisation de 
la théorie de la mesure. 


I.1 - Expérience aléatoire et univers 


Définition 1.1 On appelle expérience aléatoire une expérience sur un 
système dont le résultat n’est pas connu d'avance et peut varier si on répète 
cette expérience. 


Exemple 1.1 Jeter une pièce de monnaie, lancer des dés, prélever des 
boules dans une urne, lancer une fléchette en direction d’une cible, observer 
la position d’une particule dans un liquide... 


Le résultat, par hypothèse unique, de la réalisation de l’expérience aléatoire 
est noté w. 


Définition 1.2 On appelle univers l’ensemble des résultats possibles. Il 
est noté (1. 


Exemple 1.2 On effectue deux jets successifs d’un dé : ( = [1,6]°. 


Exemple 1.3 On lance indéfiniment une pièce de monnaie : un résultat 
possible est alors une suite de l’ensemble {F; P}, et donc A = {F; PY\, 


La difficulté vient du fait qu’il est possible, pour une même expérience 
aléatoire, de définir plusieurs univers, suivant ce que l’on entend par le 
terme « résultat possible >. 
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Par exemple, pour une expérience aléatoire consistant à prélever une boule 
dans une urne contenant 2 boules rouges et 3 boules noires, on peut 
considérer qu’un résultat possible est une couleur (Q = {N; R}) ou l’une 
des 5 boules (9 = {R;; Ro; Ni; No; Na}. 

De même, pour le lancer d’une fléchette contre une cible, on peut considérer 
comme résultat possible le point d'impact (0 = R°, après avoir muni le 
plan d’un repère), ou la trajectoire suivie par la fléchette (Q = C([0; 1]; R°), 
ensemble des applications continues de [0; 1] dans R°). 


Remarque : si on répète la même expérience aléatoire d’univers (?, on 
pourra choisir comme univers N° dans le cas de n répétitions, et (À si on 
la répète indéfiniment. 


1.2 - Evénements 

C’est une propriété € énonçable (c’est-à-dire accessible à l’expérience), 
vérifiée ou non selon le résultat obtenu. On l’identifie à l’ensemble des 
résultats de l’expérience pour lesquels elle est vérifiée : 


€ est identifiée à {w € N/E est vraie lorsque w est réalisé}. 


En pratique, on ne s’intéresse souvent qu’à un sous-ensemble d'événements. 
C’est le cas par exemple lorsque ( = R : on considère les parties borélien- 
nes, et pas toutes les parties de R (Voir annexe 1). 


Notation : on note À l’ensemble des événements relatifs à l'expérience 
aléatoire. On a donc par définition À C P(Q). 


On souhaite pouvoir définir certaines opérations sur les événements, et 
on utilise la correspondance suivante entre vocabulaires probabiliste et en- 
sembliste : 


Terminologie probabiliste | Terminologie ensembliste 


Evénement certain Ensemble entier 
Événement impossible Ensemble vide 
Événement élémentaire Singleton 
Événement contraire de À Complémentaire de À 
À ou B Réunion de À et B 

A et B Intersection de À et B 
À implique B À inclus dans B 
À et B incompatibles À et B disjoints 
w réalise À w appartient à À 


On exige que À contienne l’ensemble vide et l’univers, et qu'il soit stable 
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pour les opérations de réunion et d’intersection finies ou dénombrables, 
ainsi que par passage au complémentaire : 


iNEeAetŸe À 
ii AEA=AEA 
ü (MEICN,4 € A) =|J4Ee A 
ieI 
iv (IEICN,AEA)= [AE A 
iel 
c’est-à-dire que À soit une tribu de parties de 1. 


Remarque : ïi et iii impliquent iv (utiliser les lois de De Morgan). 

Si l’on s'intéresse à un ensemble d'événements F qui ne forme pas une 
tribu, on posera À = T(F), tribu engendrée par F (c’est la plus petite 
tribu, au sens de l'inclusion, qui contient F). 


Exemple 1.4 


1. Si ( est fini ou dénombrable, on s'intéresse naturellement aux événe- 
ments élémentaires {w;};er. La tribu engendrée est alors P(Q). 


2. SiF est constitué d’un nombre fini ou dénombrable d'événements (À; );er, 
qui forment une partition de (1, la tribu engendrée est exactement l’en- 
semble des réunions quelconques d'événements À;. Par exemple, en 
considérant une partition F = {A, A} de {, on a À = {9,0, À, A}. 

3. 51 —=R ou {2 = R”, on considère souvent comme tribu À la tribu des 

n 
boréliens (engendrée par les ouverts, ou bien par les pavés ] [les vil, 
i=1 
avec pour tout à € [l;n],a; < b;, ou bien, dans le cas de R, par les 


ouverts | — co; a[,a € R}). On ne peut pas prendre P(R) (voir annexe 


1). 
Définition 1.3 On appelle événement tout élément de la tribu A. 


Définition 1.4 On appelle événement élémentaire tout singleton (partie 
constituée d’un seul élément) de la tribu À. 


Exemple 1.5 On lance deux fois un dé à six faces. On pose A = [1;6]° 
et À = P(Q). 

On considère À : « la somme obtenue est supérieure ou égale à 11 >. 

On a: A=1{(5;6);(6,5);(6,6)} et À est un événement (A € À). 

On considère B : « la somme obtenue est divisible par 3 et par 4 >. 

On a : B = {(6,6)} et B est un événement élémentaire. 
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Attention : ne pas confondre résultat possible (w € {) et événement 
élémentaire ({w} € P(Q)). En particulier, on verra, lorsqu'on aura défini 
une probabilité P, que l'écriture P(w) n’a aucun sens, et on prendra bien 
garde à écrire P({w}). 


Définition 1.5 Le couple ({; A), où { est l'univers et À une tribu de 
parties de {), est appelé espace probabilisable. 


I.3 - Probabilité 


Il s’agit d’affecter à chaque événement À un poids P(A) indiquant sa 
< chance > d’être réalisé si l’on effectue l’expérience aléatoire. 


Des considérations relatives à l'expérience peuvent conduire, dans le cas où 
(2 est fini, à affecter des poids de probabilité identiques à chaque événement 
élémentaire : ce sera l'hypothèse d’équiprobabilité, par exemple lorsqu'on 
jette un dé équilibré, que l’on tire des cartes dans un jeu bien battu, que 
l’on prélève des boules indiscernables..…. 


Une autre approche est l’approche <« fréquentiste > : on se donne un événe- 
ment fixé À, on répète n fois l'expérience aléatoire et on note n1 le nombre 
de fois où l'événement À a été réalisé. La fréquence de réalisation de À 


Lé Lé e ° TA # 
au cours de ces n répétitions est donc : ——. On démontrera que, lorsque 
n 
. TA | 
n tend vers l'infini, — fluctue de moins en moins, autour d’une valeur li- 
n 


mite f4 (c'est la loi faible des grands nombres, voir chapitre VIII), appelée 
fréquence de réalisation de À. 

La limite principale de cette approche est qu’elle ne concerne que des 
expériences aléatoires aisément répétables, et dans des conditions iden- 
tiques. 

Cependant, l’application f possède les propriétés élémentaires suivantes : 


1. VA € À, fA > 0 (positivité) 

2. fa = 1 (totalité) 

3. V(A,B)Ee A,ANB == faus = fa + fs (additivité) 

Par analogie avec ces trois propriétés de la fréquence, on définit ce qu’est 
une probabilité de manière purement axiomatique (présentation due à Kol- 


mogorov), sans référence à une quelconque observation de la réalisation de 
l'expérience aléatoire : 


Définition 1.6 Étant donné un espace probabilisable ({; 4), on appelle 
probabilité sur ({; À) toute application P : À — R satisfaisant aux trois 
aziomes suivants : 
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1. VAE À, P(A) > 0 (positivité) 
2. P(Q) = 1 (totalité) 


3. Pour toute suite (A,) d'éléments deux à deux disjoints, 
+00 £ 
6 — 
P(U 4) = ) P(A,) (additivité) 
on n=0 


Remarque : avec le vocabulaire de la théorie de la mesure, P est donc 
une mesure positive finie, de masse totale égale à 1. 


Définition 1.7 Soit À € A. 
Si P(A) = 0, on dit que À est un événement presque impossible. 
Si P(A) = 1, on dit que À est un événement presque certain. 


Remarque : on se place dans le cas d’un univers fini, ( = {u;---;w,}, 
et on s'intéresse aux événements élémentaires en posant comme tribu À — 
P(Q). La donnée de n nombres réels positifs p1,:-:,p, de somme égale à 
1 permet de définir une probabilité P sur À en posant : 

iVieli;n], P({w;}) = 9»; 

ii VAE P(Q), P(A) = ÿ pi (puisque P doit être additive) 

i/wW;EA 

Prenons le cas du jet d’un dé, où l’on pose { = [1; 6]. 
La donnée de 


l 5 
em __—— est ne ZE — t = — 
P1 — P2 — D3 — Pa — Ds 10 Et D6 10 


permet de définir une probabilité P comme décrit ci-dessus. 
Si on note À l’événement <« le résultat est pair >, alors : 


7 
P(À) — ÿ Pi = P2 + Pa + P6 — 10 
i/w;EA 
On procède de la même façon lorsque {? est dénombrable, en se donnant 
une suite de réels positifs (p;);en tels que la série Ÿ p; converge vers 1. 
i>0 
Cas particulier important : le cas d’équiprobabilité (9 fini, de 
cardinal n). 


Des considérations relatives à l'expérience (dé équilibré, boules indiscer- 
nables, ...) peuvent conduire à définir une probabilité P sur P(Q) telle 


que : 


P({ui}) = P({uwi}) == P({uwn}) 
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1 7 
On à alors : Vie [l;n], P({w;}) = E et P est entièrement déterminée, 


puisqu'elle est connue sur les n événements élémentaires {w;}. En effet : 


VAE P(Q),P(A) = P(Uu) 


WE À 
— > P({w}) (additivité de P) 


wE À 


Définition 1.8 L'application P définie ci-dessus est appelée la probabilité 
uniforme. 


Dans ce cas, les calculs de probabilité se ramènent à des problèmes de 
; : Card(A) 
dénombrement, puisque P(A) — Card(Q) 


Exemple de probabilité non uniforme : on lance une fléchette contre 
la cible suivante : 


On note la couleur obtenue : on pose donc 9 = {J; N;R}. 
Si la probabilité de chacun des trois événements élémentaires est propor- 
tionnelle à l’aire de chacune des trois parties colorées, on a : 


1 3 5 
PU} = SPANDH = PUR) => 
9 9 9 
L'exemple 1.6 constitue aussi un cas où P n’est pas uniforme. 


Propriété 1.1 Toute probabilité P possède les propriétés suivantes : 
1. P(ÿ)=0 
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2. V(A;,B)e A,AC B= P(A) < P(B) 
3. VA € À, P(A) € [0; 1] et P(A) = 1 — P(À) 
4. Formule du crible de Poincaré : V(A1;:::; An) € 47, 


P(U A) = DP(4)- Y P(ANA,) 
i=1 1<i<n 1<i1 <io <n 
HT OÙ P(ANAN- NA) 
1<i1 Ki2 << ip EN 
+(—-1) I P(AN:--NA,) 


5. Si(A;);en est une suite croissante d'événements (au sens de l’inclusion), 
alors la suite de réels (P(A;));en est croissante, et : 


ir, P(4r = P(Ü4) 


6. Si (A;);en est une suite décroissante d'événements (au sens de l’inclu- 
sion), alors la suite de réels (P(A;))ien est décroissante, et : 


ir, Pr = P (NA) 
Remarque : pour n — 2, la formule de Poincaré s’écrit : 
P(A1 U A2) = P(A1) + P(42) — P(AiN A) 
Pour n = 3, elle s'écrit : 


P(A1 U A2 U 43) — P(A1) + P(A2) + P(A3) 
— P(A; N A2) — P(A;iN A3) — P(AN A3) 
+ P(A1 N 42 N 43) 


Démonstration des propriétés de P : 
1. On utilise l’additivité de P : 


ae 


P(AU 0) 
= P(Q) = P 
= P(9) = 0 
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2. On décompose B : AC B= B=(BNA)U A (union disjointe), d’où : 


P(B) = P(BNA)+P(4) 
= P(B)- P(A) = P(BNA) 
= P(B)- P(A) > 0 (par positivité de P) 


3. D’après la propriété précédente : 
ACAN —= P(A) 


P(Q) 
= P(A)<1 


< 
< 


et d’autre part : 
AUA=N= P(A)+P(A)=1 


4. On démontre la formule par récurrence sur n (voir l’exercice 3.1 pour 
une autre démonstration, utilisant les propriétés de l’espérance). 
Soit F, la propriété : V(4:;..-; 4,) € 4”, 


P(U A) = SDP(A4)- D PNA) 
i=1 1<i<n 1<i1 <i2<N 
+(—1)61 ÿ P(A, NAN: NA) 
1<i1 ia <r<ig En 
+(—1) I P(A NN Ah) 
Pour n = 1 : il est clair que P, est vraie. 
Avant de montrer que : Vn € N, Pr — Pn+1, on va démontrer que F2 
est vraie car la méthode sera identique pour montrer l’hérédité : 
AUA> = AU(4N Ai) (union disjointe) 
= P(AUA:) = P(Ai)+P(AiN Ai) 
Or : A2 (42 N A1) U (420 A1) (union disjointe) 
= P(A4) = P(A4 NA) + P(AoN Ai) 
d’où : P(A;U A4?) = P(Ai) + P(A2) — P(AiN 4) 


On démontre à présent que : Vn EN, Fan — Pr. 


(U A) U (Ana N U 4) (union disjointe) 
i=1 i=1 
P(U 4) + P (an nl) 4) 

i=1 


i=1 


n+1 


Ja 
ni 
i=1 


Probabilité 19 


Or Ah+1 se décompose sous la forme suivante : 


An+1 = (an N L) 4) U (ans N L) 4) (union disjointe) 
i=1 i=1 


On a donc : 
n+1 n n 
la (U 4) = P (U A) + P(Any) — PCA nt] 4) 
i=1 i=1 j=1 
On développe ensuite en utilisant P, : 
P (a n(l] 4) = P (Ua N Ans) 
i=1 i=1 
= Ÿ_ P(A N Any) 
i=1 
_ D» P(4;, N Ai, N Ann) + °°: 
1<i1<i2<n 


+(—-1)  P(A NN Au) 


Donc finalement : 


n+1 
P(U A) — 3 P(A;) n >» P(4;, N À) 
i=1 1<i<n+1 1<i1 <i2<n+1 
+ TT 
eo D» P(A,NnA,N:.1NÀ,) 
111 Ki2 << <iy SN +1 


+(—1) P(A NN Au) 


5. La suite de réels (P(A,)) est croissante (d’après la propriété 2), et 
majorée par 1 (d’après la propriété 3). Elle est donc convergente, et sa 
limite est inférieure ou égale à 1 (c’est un résultat important d'analyse : 
une suite croissante majorée de réels converge, à savoir démontrer). 
L'idée de la démonstration repose sur l’introduction d’une suite d’événe- 
ments deux à deux disjoints, ce qui va permettre d'utiliser l’additivité 
de P. 

La suite (4,) étant croissante (pour l’inclusion), on a, pour tout entier 
n 


n, B À; = À, ; on définit une suite d'événements (B;);en par : 
i=0 


Bo —= Ào et Vi > Le B; —= À;\A;-: 
www.Ebook/77.com 
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(la notation \ signifie « privé de >, autrement dit A\B = AnB). 


On a : 


i—=0 


i=0 


En effet : soit x € (JA: et soit 9 = min{i € [0;n]/x € À;}. 


i=0 


Si = 0, x € Ao = Bo, donc x € | JB. 


1—=0 


n 
Si 10 > 0, xe À et Z é ÂAio-1; donc x € D: Ce (JB. 


D'où : 


i=0 


1—0 


i=0 


L'autre inclusion est évidente puisque pour tout entier ?, B; € À;. On 
en déduit, grâce à l’additivité de P : 


P(Ü4) = r(Ü2) = > Pa) 


i=0 


On revient ensuite aux sommes partielles : 


>_,P(B) = 


6. Passer au complémentaire. 


lim 


n— +00 2_ P(B:) 
im P(Us) 
im, P(U4) 


i=0 
lim P(4;) 


n— +00 


Remarque : les propriétés qui viennent d’être démontrées sont communes 
à toutes les mesures positives (sauf la troisième pour laquelle il faut sup- 
poser en plus que la mesure de { vaut 1). 


Définition 1.9 Le triplet (Q; À; P) est appelé espace probabilisé. 
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I.4 - Probabilité conditionnelle 


On se donne un événement B qui est réalisé et, disposant de cette infor- 
mation, on souhaite modifier la probabilité affectée aux événements À de 
la tribu 4 (ceux qui ont une intersection vide avec B auront alors natu- 
rellement une probabilité nulle, et B aura bien sûr une probabilité égale à 
1). 

On ne change donc pas d’espace probabilisable (c’est toujours le couple 
(Q; 4)), on modifie seulement l’application P. 


Définition 1.10 Soit B un événement de probabilité non nulle. On ap- 
pelle probabilité conditionnelle à B, ou probabilité sachant B, associée à P 
l’application : 
AR 
P(ANB) 
A À 
7" PB) 


P3 : 


Notation : on note aussi P(A/B) pour Pg(A). On sera alors attentif au 
fait que c’est une simple notation, et que AÀ/B n’est pas un événement. On 
utilise dans la suite indifféremment l’une de ces deux notations. 


Propriété 1.2 L'application PR est une probabilité sur (Q; À). 
Démonstration : laissée au lecteur (vérifier les trois conditions). 

Cas particulier de l’équiprobabilité : 

on se place dans le cas où l’univers {? est fini, la tribu À est égale à P(Q) 


et P est la probabilité uniforme. Soit B un événement de probabilité non 
nulle, distinct de (2. On a alors : 


Card(ANB) 
PA(A) — P(ANB) Card(()  Card(ANB) 
B(A) = P(B)  Card(B)  Card(B) 
Card(Q) 


On en déduit la valeur de P3 sur les événements élémentaires : 


Vw € B, Pg({w}) 0 
1 


Vu € B,Pg({w}) — Card(B) 


La probabilité Pg n’est donc pas uniforme, mais sa restriction à P(B) est 
uniforme, et elle est bien sûr toujours nulle sur les événements élémentaires 
qui ne sont pas inclus dans B (voir l’exemple 1.6). 
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Propriété 1.3 Soit B un événement de probabilité non nulle. Alors : 
VA € À, P(AN B) = P(A/B)Pr(B) 


Par récurrence, on obtient, sous réserve que toutes les probabilités condi- 
tionnelles qui suivent soient bien définies, la formule des probabilités en- 
chaînées : 


P(AN:-. NA) = P(4/(4Nn:-N 4n))P(42/(A3 NN A4) 
… P(An_1/4»)P(Ah) 


I.5 - Formule des probabilités totales 


Définition 1.11 On appelle système complet d'événements toute famille 
d'événements (A;);er (I étant une partie non vide de N) telle que : 


2. Vij)el°,izj= ANA; =-0 
3. (JA4=Q 


1ET 


Propriété 1.4 Soit (A;);er un système complet d'événements. Alors on a 
la formule des probabilités totales : 


VAE A,P(A)= 3 P(A/A;)P(4;) 
iEI 
(sous réserve que pour tout à, P(A;) soit non nulle, afin que les probabilités 
conditionnelles soient bien définies). 


Démonstration : comme (AÀ;);er est un système complet, on peut écrire 
A = AN B À, | et on a donc la décomposition de À sous forme d’union 
iel 
disjointe : 
A=|] (4 N A) 
iel 
Par additivité de P, P(4) = 9 P(ANA;) = Ÿ_ P(A/A;)P(A;). 
iel iel 
Remarque : on écrit souvent la formule des probabilités totales relati- 
vement au système complet {A1; A:} : 


P(A) = P(A/A:)P(Ai) + P(A/A1)P(Â:) 
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Exemple 1.6 On considère une urne U1 contenant deux boules blanches 
et une boule noire, et une urne U» contenant une boule blanche et une boule 
noire. On choisit une urne au hasard puis on prélève une boule dans cette 
urne. Les boules sont indiscernables au toucher. 

Quelle est la probabilité de tirer une boule blanche ? 

On commence par poser l’univers : 


Q = {(U:; Bi); (Us; B2); (Ur; M1); (U; B3); (Uz; No)} 


On note B l'événement < la boule tirée est blanche >, E1 < la boule tirée 

est extraite de l’urne U. > et E2 <« la boule tirée est extraite de l’urne Uno >. 

D'après l'énoncé, P(E:1) = P(E2) et comme le système {E:; E2} est com- 
1 

plet, P(E1) + P(E:) = 1. Par conséquent, P(E1) = P(E2) — 3 

L'énoncé permet ensuite de définir les probabilités conditionnelles P#, et 

Pr, : les boules étant indiscernables, Pr, prend la même valeur sur chaque 

événement élémentaire appartenant à P(Ei), et elle est nulle sur chaque 

événement élémentaire appartenant à P(E;). 

On a donc : 


Pr ({(Ui; B1)}) = Pa ({(Ui: B2)}) = Pr, ({(U:; N:)}) = : 


et : 
Pr ({(Us; B3)}) = Pr: ({(Uz; N2)}) = 0 


Le même raisonnement permet de définir Pp, : 
1 
Pr,({(Uni Bs)}) = Pr, ({(U2i M)}) = > 


et : 
Pre, ({(Ui; B1)}) = Pre ({(Ui: Bo)}) = Pr ({(Ui; N1)}) = 0 


La probabilité P est alors entièrement déterminée puisqu'on a, par la for- 
mule des probabilités totales : 


VAE P(Q),P(A) = Pa(4)P(E1) + Pr,(A)P(En) 


1 1 
= Pr (A) x 5 + Pe,(4) x > 
On l’applique à l'événement B : 
1 1 2 1 1 1 7 
(B) En ( )xX 3 + Pr, ( )xX> 3*5t2*5 2 


On obtient de la même façon la valeur de P sur chacun des 5 événements 
élémentaires : 


P({(U; B1)}) = PU; B2)}) = P({(U; M)}) = : 
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et : 
P({(Uz: Bs)}) = P({(Uz: Ne)}) = : 


En particulier, on remarquera bien que P n’est pas la probabilité uniforme ! 


I.6 - Formule de Bayes 


Elle était appelée < formule de la probabilité des causes >, car elle permet 
de calculer P(A/B) connaissant P(B/A). 


Propriété 1.5 Soient À et B deux événements de probabilité non nulle. 
Alors on peut écrire : 


P(A/B)P(B) 


P(B/A) = — Er 


(formule de Bayes) 


Démonstration : P(ANB) = P(A/B)P(B) et P(BNA) = P(B/A)P(A), 
puis P(ANB) = P(BN À). 


Cas particulier : lorsqu'on a un système complet (A;);er, on obtient : 


Vn EI, P(An/A) = a 
_ | PAJADP(An) | 
D er P(A/A;)P (Ai) 
Dans le cas d’un système complet { A1; Ai} : 
P(A/A:)P(Ai) 


PATATE ATA)P(A) + PAJ ADP) 


Exemple 1.7 On considère une urne U1 contenant deux boules blanches 
et une boule noire, et une urne U; contenant une boule blanche et une 
boule noire. On choisit une urne au hasard puis on prélève une boule dans 
cette urne. Les boules sont indiscernables au toucher. On obtient une boule 
blanche. 

Quelle est la probabilité que la boule soit extraite de l’urne U; ? 

On reprend l'univers et les notations précédentes : 


Q = {(U:; Bi); (Ui: Be); (U; Ni); (Uo; B3); (U; No)} 


On note B l'événement « la boule tirée est blanche >, E; <« la boule tirée 
est extraite de l’urne U. >, et E2 < la boule tirée est extraite de l’urne Un >. 
Une probabilité P a été définie, via les probabilités conditionnelles Pr, et 
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Pr, (voir exemple 1.6). 
On applique la formule de Bayes en utilisant le système complet {E:; E2} : 


P(B/E1)P(E) 


P(E/B) — P(B/Ei)P(E1) + P(B/E:)P(E) 
2 1 
_ 373 4 
2 1 I 1 7 
3*2"2*2 


[.7 - Indépendance de deux événements 


On traduit le fait que la réalisation de l’un n’a pas d’influence sur la 
réalisation de l’autre. 


Définition 1.12 À est dit indépendant de B si P(A/B) = P(A) ou si 
P(B) = 0. 


Le fait d'ajouter le cas P(B) = 0 permet d’avoir la condition nécessaire et 
suffisante suivante : 


Propriété 1.6 À est indépendant de B si et seulement si P(AN B) = 
P(A)P(B). 


Démonstration : on suppose que À est indépendant de B. 

Si P(B) = 0, alors P(AN B) = 0 car (AN B) CB. 

Si P(B) £ 0, alors P(A/B) = P(A) donc P(AN B) = P(A)P(B). 
Réciproquement, on suppose que P(AN B) = P(A)P(B). 

Si P(B) = 0, alors d’après la définition À est indépendant de B. 

Si P(B) Z 0, alors UE = P(A), donc P(A/B) = P(A) et d’après la 
définition, on a bien que À est indépendant de B. 


Remarque : la propriété précédente montre que la relation est symétrique, 
et on dit alors que À et B sont indépendants. 


Exemple 1.8 On jette un dé équilibré. 

On pose ( = [1,6], 4 = P(Q) et P la probabilité uniforme. 

Soient les événements suivants : À = {2;:4;6}, B = {5;6} et C = {5}. On 
a immédiatement : 


P(A) = : P(B) = = P(C) = = P(AN B) = à P(ANC) = 0 et 
P(BNC) = a. 


On en conclut que À et B sont indépendants, mais que À et C ainsi que 
B et C' ne le sont pas. 
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Attention : ne pas confondre incompatibilité (ANB = ()) et indépendance 
(P(ANB) = P(A)P(B)). 

En particulier, on notera bien que la notion d'indépendance, à la différence 
de celle d’incompatibilité, dépend de la probabilité P. 


Exercice : reprendre l’exemple consistant à jeter un dé, et définir une 
autre probabilité P’ pour laquelle À et B ne sont pas indépendants. 


Propriété 1.7 
A et B indépendants = À et B indépendants 


& Aet B indépendants 
& Àet B indépendants 


Démonstration : laissée au lecteur (en cas de difficulté, voir la correction 
de l'exercice 1.6). 


I.8 - Indépendance de n événements 


Définition 1.13 On dit que n événements À:,:--, A, sont mutuellement 
indépendants si : 


VI Cfin],I # o,P(NA) = [[P(4) 


iel A | 


Ils sont dits indépendants dans leur ensemble si : 
P(N 4) = | [ P(4;) 
i=1 i=1 


La définition s'étend au cas d’une suite d'événements (4,), en considérant 
l'indépendance mutuelle des événements de toute sous famille finie. 


Remarque : l'indépendance mutuelle entraîne l’indépendance des événe- 
ments 2 à 2, et la réciproque est fausse, comme le montre l’exemple suivant : 


Exemple 1.9 On lance deux fois une pièce de monnaie équilibrée. 

On pose Q = {P;, F}Y°, A = P(Q) et P la probabilité uniforme. 

On considère les événements suivants : À <« le premier jet a donné Pile >, 
B <« le deutième jet a donné Pile >, et C <« les deux jets ont donné le même 
résultat >. i 


On a : P(A) = P(B) = P(C') = 5 P(ANB) = P(ANC) = P(BNC) = 
1 1 

2’ et P(AN BNC) — 2 Les événements À, B et C ne sont donc pas 
mutuellement indépendants, mais ils sont indépendants deux à deux. 
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Exercice : étant donnés n événements, combien doit-on vérifier d’égalités 
pour montrer qu'ils sont mutuellement indépendants ? 
(réponse : 27 —n—1). 


I.9 - Enoncé des exercices 


Exercice 1.1 Soient (Q:; P(Q:); Pi) et (Q2; P(Q); P>) deux espaces pro- 

babilisés avec {1 et (2 finis. 

a) Montrer que l'application P : {(w1;w2)} - Pi({w1})P({w}) et telle 
que VA € P(Q: x (Do), P(A) = DD P({w}) est une probabilité sur l’es- 


wE À 
pace probabilisable produit : (1 x Oo; P(Q x No)). 
P est appelée probabilité produit. 
b) Montrer que si P. et P, sont uniformes, alors P est uniforme. 


Exercice 1.2 6 personnes doivent prendre place dans 3 voitures pouvant 
chacune recevoir de 0 à 6 passagers. Chaque personne choisit un véhicule 
au hasard. 


a) Décrire (1. 
b) Quelle est la probabilité que dans chaque voiture montent exactement 2 
personnes ? 


Exercice 1.3 Une urne contient n boules (indiscernables au toucher) nu- 
mérotées par les entiers de 1 à n. On extrait successivement avec remise 
N boules. 


a) Décrire l'univers. 
b) Quelle est la probabilité d’avoir obtenu au moins 2 numéros distincts ? 


c) Quelle est la probabilité d’avoir obtenu au moins une fois les boules 1, 
2e 3? 


Exercice 1.4 Soient À et B deux événements tels que : 


P(4) = ©, P(B)= > et P(ANB) = ; 


8 ) 
Calculer P(A/B). 


Exercice 1.5 Soient À et B deux événements indépendants tels que : 
2 


P(4) = > et P(AUB) = © 


Calculer P(B/À). | 
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Exercice 1.6 


a) Vérifier que : 


À et B indépendants = À et B indépendants 
& Aet B indépendants 
& Àet B indépendants 


b) Établir que deux événements A et B sont indépendants si et seulement 


. P(ANB)P(ANB) = P(ANB)P(ANB) 


Exercice 1.7 On considère trois urnes : U, composée de deux boules noi- 
res et deux boules rouges, U, composée d’une noire et deux rouges, Uz 
composée d’une noire et trois rouges (les boules sont indiscernables au tou- 
cher). On tire une boule dans U:, une boule dans U:, et on les met dans 
Us, puis on tire une boule dans U3. On constate que cette boule est noire. 
Calculer la probabilité que la boule tirée dans U; ait été rouge. 


Exercice 1.8 On suppose qu’un couple a la même probabilité d’avoir à 
chaque naissance un garçon ou une fille. On considère un couple ayant 2 
enfants. 


a) Quelle est la probabilité qu'ils aient une fille sachant qu'ils ont un 
garçon ? 

b) Quelle est la probabilité qu'ils aient une fille sachant que l’on a rencontré 
par hasard l’un des deux enfants, que c'était un garçon et qu'il était 
l'aîné ? 


Exercice 1.9 Soient À, B et C trois événements indépendants 2 à 2, avec 
P(C) > 0. 

Donner une condition nécessaire et suffisante sur À, B et C' pour que À 
et B soient indépendants relativement à la probabilité conditionnelle Pc. 


Exercice 1.10 On jette une paire de dés non pipés. Calculer la probabilité 
que la somme obtenue soit supérieure ou égale à 10, sachant que l’un au 
moins à donné 5. 


Exercice 1.11 Problème posé à Pascal par le chevalier de Méré. 

« Qu'est ce qui est le plus probable : sortir au moins un 6 en lançant 4 fois 
un dé ou au moins un double 6 en lançant 24 fois deux dés ? > 

(Préciser l'univers dans chacun des cas au préalable). 
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Exercice 1.12 Problème posé à Galilée par le Duc de Toscane. 

«< Pourquoi, quand on effectue trois lancers de dé, obtient-on plus souvent 
la somme 10 que la somme 9, bien que chacune soit obtenue de 6 manières 
différentes ? > 


Exercice 1.13 Probabilités et arithmétique. 
Soit n un entier supérieur ou égal à 2. On note : 


p(n) = Card{1 < p < n/pgcd(p;n) = 1} 
k 
Soit n = El p;* la décomposition de n en produit de facteurs premiers. Le 


i=1 
but est de démontrer que : 


sf 


On tire au hasard un entier compris entre 1 et n. On note À l'événement 
< le nombre obtenu est premier avec n >, et pour i € [1;k], on note À, 
l’événement < le nombre obtenu est divisible par D; >. 


1. Définir un espace probabilisé modélisant l'expérience aléatoire. 


Exprimer P(A) en fonction de p(n) et n. 


2. 
1 
8. Montrer que Vi € [1;k], P(A;) — D 
4. Montrer que les événements A:,:::,A% sont indépendants (dans leur 


ensemble). 
5. Exprimer À en fonction des À, et en déduire que : 


Exercice 1.14 Matrices stochastiques. 
Une particule se déplace sur les 3 sommets d’un triangle (ABC) de la façon 
suivante, à l'issue de chaque seconde : lorsqu'elle est en À, elle y reste avec 
une probabilité de 0.25, elle va en B avec une probabilité de 0.5, et en C 
avec une probabilité de 0.25. Lorsqu'elle est en B, elle va en À avec une 
probabilité de 0.5, et va en C' avec une probabilité de 0.5. Lorsqu'elle est en 
C', elle va toujours en B. On suppose qu’elle est en À à l'instant initial. 
Quelle est la probabilité qu’elle soit en B au bout de 60 secondes ? 
On note À, l'événement : « la particule est en À à l'instant n >, an — 
On 
P(A,) (mêmes notations pour B et C), et Xa = | ba 
Cn 
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1. À l’aide de la formule des probabilités totales, déterminer À € Ma3(R) 
telle que : Vn € [0; 59], Xr41 = AXn: 

2. À est appelée matrice stochastique. Quelle remarque peut-on faire sur 
ses coefficients ? 


3. Montrer que 1 est valeur propre de À, et en déduire son spectre. 


4. Diagonaliser À et déterminer X6o0. 


I.10 - Correction des exercices 

Exercice 1.1 

a) Soient (1 = {a;,1 < i < Card} et = {b,,1 < j < Card}. On 
montre que P vérifie les trois axiomes. 
Positivité : c'est clair puisque P, et P2 sont positives. 
Totalité : 


P(UXM) = D, P({w}) 


>_P((as b;)}) 
>_P({&})P:({b;}) 
>_Pi({a}) >, Pa({b;}) 


Pi(Q)P2(Q) 
1 


Additivité : il suffit de vérifier l’additivité de P pour la réunion de deux 
événements disjoints. ( étant fini, P(Q) est également fini (quel est son 
cardinal ?), et on étendra le résultat par une récurrence immédiate à 
toute union finie d'événements disjoints. 

Soient À et B deux événements disjoints : 


>, P({w}) 


we AUB 


= D) P({w})+ > P({w}) 
wWEA weB 
(À et B sont disjoints et les deux sommes sont finies) 


— P(A)+P(B) 


P(AUB) 


b) Les événements élémentaires de P((:1 x Q) sont les singletons, c’est-à- 
dire les éléments de la forme {(a;b)} où a € M et b € QD. 
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On calcule la valeur de P sur les singletons : 


P({(a;b)}) Genre) 
1 


Card (): d Card (do 
1 


Card(A; X (2) 


Remarque : on considère une expérience aléatoire pour laquelle on 
choisit comme espace probabilisé (Q; P(Q); P), P étant la probabilité 
uniforme. On répète n fois cette expérience. Pour munir l’espace pro- 
babilisable (Q°; P(Q")) d’une probabilité, on choisit la probabilité pro- 
duit, qui n’est rien d’autre que la probabilité uniforme d’après la ques- 
tion b). C’est cette démarche que l’on utilise implicitement dans de 
nombreux exercices, dès que l’on répète une expérience aléatoire pour 
laquelle on est en situation d’équiprobabilité. 


Exercice 1.2 


a) Soient V1, V2 et V3 les trois véhicules. On a 6 répétitions de la même 
expérience aléatoire (choisir l’un des 3 véhicules). On pose donc : 9 = 
(Vi Va Vs}. 

b) On choisit comme tribu À = P(Q), car { est fini et on veut que la tribu 
contienne chaque événement élémentaire. On prend comme probabilité 
P la probabilité uniforme (tirages équiprobables). 

Soit À l’événement < dans chaque véhicule prennent place exactement 
2 personnes >. 


Card À 

Pui P est unif P(A) = 

uisque P est uniforme, P(A) Cardo 
Calcul de Card À : À est l’ensemble des 6-uplets où apparaissent exac- 


tement 2 fois V1, 2 fois VS et 2 fois V3. On a donc k façons de placer 


les 2 VA, puis ( 4 façons de placer ensuite les 2 VS et enfin une seule 


2 
/ 6 4 
façon de placer les 2 V3. Par conséquent : Card À — ; ) ( ) ) — 90. 
Comme Card({) = 3°, on obtient P(A) — : 


Exercice 1.3 

a) On répète N fois la même expérience aléatoire (prélever une boule parmi 
n), et on pose donc A = {1;-..;n}". On choisit comme tribu À = 
P(Q), et on prend comme probabilité P la probabilité uniforme. 
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b) Soit À l’événement <« le résultat obtenu comporte au moins 2 numéros 
distincts >. On calcule la probabilité de À (qui est l’événement <« le 
résultat obtenu comporte N fois le même numéro >). 


_ n 
et donc P(A) = 1 — P(A) = 1 - EN 


c) On note, pour à € [1;3], À; l'événement < le résultat obtenu comporte 
au moins une fois le numéro i >, et on cherche P(A1 N 4 N 43). On 
raisonne sur les événements contraires : 


P(ANANA3) = P(AiU AU 43) 


P(Ai) + P(A2) + P(A43) — P(A;N À) 
— P(Ai N 43) — P(A2 N À3) + P(AiN AN À3) 


Un calcul simple de dénombrement donne : 


PA) = P@) = Ps) = ED 
PAin 2) = PA NA) = PA ns) — Lt M 


a n — 3)" 
PNA ns) = M 
On obtient donc : 
m1)" 
P(A NAN A9) = 1-88 + ST 


Exercice 1.4 OO 
P(B) étant non nul, P(A/B) est bien défini. On a : 


P(ANB) _ P(AUB) 


CPE PE — PE 
3 LL I 
Comme P(AUB) = P(4)+P(B)- P(ANB)= +372, 0n ob- 
tient : 
5) 
RE 
P(A/B) = —$=° 
Lz 
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Exercice 1.5 : 
P(A) étant non nul, P(B/À) est bien défini. On à : 


- P(BNnA) P(4)-P(BNA) 
PET PA PA) 


et comme À et B sont indépendants, 


P(A) — P(B)P(4) 


PA —]1- P(B) 


P(B/A) = 


Calcul de P(B) : 


_ 2 
d’où P(B) = ————— = =, et donc P(B/A) = 3: 
Exercice 1.6 
a) Si À et B sont indépendants, alors : 


P(ANB) = P(A)- P(ANB) = P(A) — P(A)P(B) = P(A)P(B) 


d’où l'indépendance de À et B. En appliquant le résultat précédent à 
B et À, on a directement que si À et B sont indépendants alors À et B 
sont indépendants. On en déduit de la même façon que si À et B sont 
indépendants, alors À et B sont indépendants, puis que À et B sont 
indépendants. On a donc montré les 3 équivalences (par permutation 
circulaire). 


b) Si À et B sont indépendants, alors, d’après la propriété démontrée au 
a) : 
P(ANB)P(ANB) = P(A)P(B)P(A)P(B) 
= P(ANB)P(ANB) 


Réciproquement, si P(AN B)P(ANB) = P(ANB)P(ANB), alors on 
P(ANB)(1 -— P(A) - P(B) + P(ANB) 
= (P(A) — P(AN B)) x (P(B) - P(ANB)) 


Il reste en développant : P(A NB) = P(A)P(B), ce qui entraîne 
l'indépendance de À et B. 
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Exercice 1.7 
On note, pour à € [1,3], À l'événement < la boule tirée dans l’urne : est 


rouge > et N, l'événement < la boule tirée dans l’urne à est noire >. On 
veut calculer P(R1/N3). 


P(N3/R1)P(R:) 
D’après la formule de Bayes : P(R1/N3) — TT PAN) On calcule 
P(N3/Ri) s 
P(N3N R:) 
P(N3/R1) TT P(R1) 
: P(N3N RiN Ro) + P(NNR N N) 


E P(R) 
(formule des probabilités totales) 
P(N3/(R2N R:))P(R2/R1)P (Bi) 
_ P(R:) 
P(N3/(N2N R1))P(N:/R1)P(Ri) 
Ÿ P(R) 
— P(N3/(RN R1))P(Ro/ Ra) + P(N3/(N2N Rù))P(N2/Rù) 


On calcule de la même façon P(N3) : par la formule des probabilités totales, 
P(N3) = P(NINRNRE)+P(NNRANNE)+P(NaNNNRE)+P(NINNNN:) 


puis on développe chacun des 4 éléments par la formule des probabilités 
enchaînées : 


P(NNRNR) = P( Na/ (a N RP (Ro/R1)P(Rà) 
_ 1,2,2 
_ 6 3 
On obtient finalement : 
1 2 2 2 1 2 2 2 92 3 1 2 11 
7 OU 7 
2,2 
. _9 4 4 
D'où P(Ri/N3) = = + 
36 


Exercice 1.8 
On pose ( = {F;G}°, on choisit comme tribu A = P(A), et on prend 
comme probabilité P la probabilité uniforme. 
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a) On note À l'événement <« le couple a une fille > et B l'événement < le 


couple a un garçon >. P étant uniforme, P(A/B) — UE — : 


b) On note G; l’événement < l’aîné est un garçon > : 


Card(A N Gi) 1 
P(A4/G) = Card(G:) 72 


Exercice 1.9 


P((ANB)/C) = P(A/C)P(B/C) 
. PANBNC) _ P(ANC), P(BNC) 


P(C)  P(C) ‘ P(C) 
P(ANBNC) _ P(A)P(C). P(B)P(C) 
P(C)  P(C) P(C) 


& P(ANBNC) = P(A)P(B)P(C) 


Comme les trois événements sont supposés indépendants deux à deux, 
on a la condition nécessaire et suffisante : À, B et C' sont mutuellement 
indépendants pour P. 


Exercice 1.10 

On pose { = [1;6]°, on choisit comme tribu À = P(Q), et on prend comme 

probabilité P la probabilité uniforme. Soit À l'événement <« la somme ob- 

tenue est supérieure ou égale à 10 >, et soit B < can au Qan d deux 
/ / . ard( AN B 3 

dés a donné 5 >. Comme P est uniforme, P(A/B) — Card(B) 11 

Exercice 1.11 

Premier cas : 4 lancers successifs d’un dé (équilibré). 

On répète 4 fois la même expérience aléatoire et on pose donc 9 = [1; 6]°. 

On choisit comme tribu À — P(Q), et on prend comme probabilité P la 

probabilité uniforme. Soit À l'événement < le résultat obtenu comporte au 

moins un 6 >. On raisonne sur l'événement contraire : 


—_  Card(A) 5“ 
PO) = = à 
Card(N) 6 
54 

On a donc P(A) = 1 — a © 0.518. 
Deuxième cas : 24 lancers successifs de 2 dés (équilibrés). 
On répète 24 fois la même expérience aléatoire et on pose donc N — 
([1;6]*)*. On choisit comme tribu À = P(Q), et on prend comme proba- 
bilité P Ia probabilité uniforme. Soit À l'événement < le résultat obtenu 
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comporte au moins un double 6 >. On raisonne encore sur l’événement 
contraire : 


Card(A)  35* 


de Card(N) 362 
3524 
On a donc P(A) = 1 — 364 © 0.491. 


Exercice 1.12 

On répète 3 fois la même expérience aléatoire et on pose donc { = [1;6]°. 
On choisit comme tribu À = P(Q), et on prend comme probabilité P la 
probabilité uniforme. On note S:10 <« la somme des 3 éléments du triplet 
vaut 10 > et S, « la somme des 3 éléments du triplet vaut 9 >. 

S10 est composé des éléments (1; 3,6), (1;4;5),(2;3;5), (2; 4; 4),(2;6;2) et 
(3; 3; 4), plus tous les triplets obtenus en permutant les éléments de ces 6 
triplets. Pour chacun des triplets (1;3;6),(1;4;5) et (2;3;5), on a 3! per- 
mutations, et pour chacun des triplets (2, 4,4),(2;6;2) et (3;3;4), on a 3 
permutations. Par conséquent : 


Card(S10) = 3 x (3!) +3 x 3 = 27 
En dénombrant les éléments de So de la même façon, on obtient : 
Card(So) = 3 x (31) +2 x 3 + 1 = 25 
On en conclut que P(S9) < P(S10). 


Exercice 1.13 

1. On pose ( = {1;---;n}, 4 = P(Q) et on prend pour P la probabilité 
uniforme (ce qui traduit le fait que l’on est en situation d’équiprobabili- 
té, chaque singleton {p} , 1 < p < n, étant affecté d’une probabilité 


égale à —). 
n 


: Card A  (n) 
2 P _ _ g() 
Comme P est uniforme, P(A) Cdo - 
Card À; n n 
3. P(A;) — +, Or À, = {Xp;/1 < À < — ue 
On a P(A;) Cardo Or PRILÈNS One CaRTA mr. 


1 
et par conséquent P(4;) = —. 

Pi 
4, l'événement À; N::-"N A4 est réalisé si et seulement si le nombre obtenu 
est divisible par chacun des p;. Comme les », sont premiers entre eux, 
ceci équivaut à dire que le nombre obtenu est divisible par le produit 


des p; (Théorème de Gauss). D'où : 
n 


AN:-:NAz es {Pi -Dr/1 <À< 
P1''"Pk 


} 
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Par conséquent, Card(A; --: A4) — , et donc : 


P1 °°" PE 


P(A NN A) = — P(A;)-... P(A) 


P1:''"Pk 


Les événements A:,..,4, sont donc indépendants (dans leur ensemble). 


5. Le nombre obtenu est premier avec n si et seulement si il n’est divisible 
k 


par aucun des »;, donc À — [) Ar. Or l’indépendance des À; entraîne 


i=1 
l’indépendance de leur complémentaire, donc : 


P(4) = I[P@ - Il (: -2) 


Comme P(A) — A on en déduit l'égalité souhaitée : 


i=1 


Exercice 1.14 


1. À,, Bn, Cn formant un système complet d'événements, on a : 


P(Any) = Pas(Anr1)P(An) + Pr, (An+1) P(Bn) + Pc, (An+1)P(Cn) 
0.25P(An) + 0.5P(B,) 


En procédant de la même façon pour P(B,,1) et P(Ch41), on obtient : 


An+1 0.25 0.5 0 An 
bn+1 — 0.5 0 1 b, 
Cn+1 0.25 0.5 0 Cn 


2. Les coefficients de À sont tous compris entre 0 et 1 (puisque ce sont 
des valeurs de P4,, Ps, et Pc.), et la somme des coefficients de chaque 
colonne vaut 1 (pour la première : P4,(An+1)+ Pa, (Bn+1)+P4,(Cn+1) = 


1). 


3. Aet ‘A ont le même spectre et d’après la remarque précédente, 


en bei fn 


est vecteur propre de ‘À, associé à la valeur propre 1. Comme det(A) — 
0 et tr(A) = 0.25, on en déduit le spectre de À : 


Sp(A) = {—-0.75;0;1} 
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4. On recherche les sous-espaces propres. On obtient : 


1 2 
E_075 = Vect —2 . Ep = Vect —] 
1 —] 
2 
et 1 = Vect 3 
2 


À est donc diagonalisable (on le savait puisqu'elle possède 3 valeurs 
propres distinctes) et À = PDP", avec : 


122 —0.75 0 0 
Peter «EL. S t D 0 0 0 
1 —1 2 0 0 1 
On en déduit X60 = PD®P-1X,. Comme on a : 
1 1 —6 8 1 
pr 21 7 0 —7 | et Xo= | 0 
+ + 4 0 


on obtient finalement : 


(—0.75)S + 6 
1 60 
(—0.75)% + 6 


| 3 
La probabilité que la particule se trouve en B vaut donc environ 7° 


Chapitre IT : Variables aléatoires : généralités 


II.1 - Définition 
Il s’agit d’une application X dont la valeur dépend du résultat obtenu lors 
de l’expérience aléatoire. C’est donc une application 


Q — R ou R” (variable réelle ou vectorielle) 
X ‘ 
wrH X(w) 


Exemple 2.1 On jette deux dés, et on pose ( = [1;6]°. 
X :w={(a;b)r a+b (somme des deux dés) 
0 s2 a et b impairs 


Y :w={(a;b)r 4 1 si a et b pairs 
2 sinon 


Exemple 2.2 On lance une fléchette contre une cible, et on pose = R°. 
D''w={(xy)r V7? +7 
(distance euclidienne du point d'impact au centre de la cible) 


Exemple 2.3 Étant donné un événement À € À, on définit son indica- 


trice DA :W+ LUE 
cu O0 sinon 


Il est naturel d'exiger que l’on puisse calculer la probabilité que « À tombe 
nm 


dans l'intervalle [a;b] > (ou dans le pavé I [le bi). Il faut donc que : 
i=1 


X7{([a; b]) € À. On rappelle que pour toute partie B de R, on pose : 
X7*(B) = {w € N/X(w) € B} 

C’est l’image réciproque de la partie B, il n’est pas question de bijection 

réciproque de X dans la notation X-(B). Comme les intervalles {a; b] 


engendrent Br, tribu des boréliens de R (voir annexe 1), cela signifie que 
X est une application mesurable. On pose donc comme définition : 
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Définition 2.1 On appelle variable aléatoire réelle sur (Q; À) toute ap- 
plication X : ( — R telle que : 


VB € Br, X7*(B) E À 
Notation : on notera v.a.r. pour variable aléatoire réelle. 


Exemple 2.4 Les variables X et Y de l'exemple 2.1 sont des v.a.r. sur 
(R°; Br2) ; la variable D de l’exemple 2.2 est continue, donc l’image récipro- 
que de tout borélien de R est un borélien de R°, et D est donc une v.a.r. ; 
enfin, la variable DA de l’eremple 2.3 est aussi une v.a.r. sur ({; 4), 
puisque À € A. 


Remarque : lorsque À = P(Q) (par exemple lorsque ( est fini et que 
l’on veut que la tribu À contienne tous les événements élémentaires), la 
condition VB € Br, X7'(B) € P(Q) est automatiquement vérifiée. 


Propriété 2.1 L'ensemble des variables aléatoires réelles définies sur un 
même espace ((); À), muni des lois usuelles, a une structure d’algèbre. 
En particulier, la somme et le produit de deux variables aléatoires réelles 
sont des variables aléatoires réelles. 


Définition 2.2 Soit XÀ une variable aléatoire réelle. Les événements du 
type X71([a;b[), X71(]la;b]), X7Y([a;b]) et X7!({a}) sont appelés événe- 
ments liés à X. 

La tribu engendrée par ces événements s'appelle tribu engendrée par X ; 
c’est par définition une tribu incluse dans À, notée Ax. 


Comme les intervalles {[a; b] engendrent la tribu des boréliens Br (voir an- 
nexe 1), on à Ax = X (BR). 


II.2 - Loi de probabilité d’une variable aléatoire 


Définition 2.3 On appelle loi de probabilité {ou distribution de probabi- 
lité) d’une v.a.r. X définie sur un espace (Q; À; P) l’application 


. J Br — (0;1] 

‘| Be P(X7(B) 

Remarque : par définition, X-1(B) = {w € N/X{(w) € B}, et cet événe- 
ment est souvent noté « À € B >. 


Propriété 2.2 L'application u ainsi définie est une probabilité sur l’espace 
probabilisable (R; Br). Elle est appelée probabilité image de P par X. 
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Démonstration : vérifier les trois axiomes de la définition d’une proba- 
bilité (en cas de difficulté, voir l’exercice 2.2). 


Notation : l'application y est parfois notée P%. 


Exemple 2.5 On lance un dé équilibré, on pose Q = [1,6], 4 = P(Q) 
et on prend pour P la probabilité uniforme. On réalise un gain nul si l’on 
obtient 1, un gain de 1 € s1 l’on obtient 2, 3 ou 4 et de 2 € si le résultat est 5 
ou 6. On note X la v.a.r. égale au gain obtenu. On a donc X(Q) = {0;1;2}. 
La loi de À, c’est-à-dire l’application 1 définie plus haut, est entièrement 
déterminée par P(X = 0), P(X = 1) et P(X = 2), c’est-à-dire par les 
poids de probabilité affectés aux éléments de son univers image X(Q). Par 
exemple pour B = [0, 7; 2] : 
P(XEB) = P(X7'(B)) 

= P(X (1) U X7({2}) 

=. P(XT (1) + P(XT"({2))) 

= P({23;4;) + P({5:6}) 

= P({2})+-.-+P({6}) 

5 


6 


Propriété 2.3 Si X est une v.a.r. sur ((;.4) et si g est bien définie et 
continue par morceaux sur X(Q), alors go X est une v.a.r. sur (Q; À). 


Démonstration : soit B € Br. Comme g est continue par morceaux, 
g ‘(B) € Br, et comme X est une v.a.r. sur ((;.4), X-*(g '(B)) € À, 
c’est-à-dire (go X) ‘(B) € A. 


II.3 - Fonction de répartition 


Définition 2.4 Soit X une variable aléatoire réelle définie sur un espace 
probabilisé ({; À; P). On appelle fonction de répartition de X l'application 


_f R—- {(0;1] 
DT EE 


Dans l’exemple précédent 2.5, on a facilement : 


si x <0 


s 0O<zxz<l 
F(x) = 
s 1<rz<2 


sa T>2 


mOoOINOIr © 
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Propriété 2.4 Toute fonction de répartition F' possède les propriétés sui- 
vantes : 
1. Fest croissante. 
2. lim F(x)=0et lim F(x)=1. 
æ—>—00 æ—}+00 
3. Fest continue à droite en tout point x de KR. 
4. Fa une limite à gauche en tout point x de KR, et : 


Vz ER, F(x) — lim F(t) = P(X = x) 
Tr 


Démonstration des propriétés de F : 
1. Soit y > x: F(y) — F(x) = P(x < X < y) > 0, et F'est donc croissante. 


2. Comme F est monotone (en l’occurrence croissante), on a l’équivalence 

suivante : 
lim F(x)=0 lim F(-n)=0 
T——00 n—+00 

(bon exercice de manipulation de la définition de la limite, voir exercice 
2.1 en cas de difficulté). 
Or F(—-n) — P(X €] — co; -n]). Notons, pour tout n € N, 4, = 
X7*(] — co; —n]). La suite d'événements (4,) est décroissante au sens 
de l'inclusion et on a donc, grâce aux propriétés de P démontrées au 
chapitre I, que la suite de réels (P(A,)) est convergente et : 


+00 
in) = P(QA) 


n=0 


= lim F(-n) = P(ÿ)=0 


n— +00 


Même démarche pour la limite en +oo. 
3. soit x E R fixé. Comme F est croissante, il suffit d'étudier la conver- 


1 
gence de la suite de réels (F (2 + =)) pour étudier l'existence et la 
valeur de la limite à droite de F en x. Par définition : 


P(e+})-r(Xe]-r+ 1) 


1 
En notant À, = X-!{|-co:x+ = | ) , on obtient une suite d'événements 


décroissante pour l'inclusion, donc la suite de réels (P(A,)) converge et : 


lim P(4) = P(Aa) 


n— +00 
n=0 


P(X1(— 00;2])) = F(x) 


+. F(: Fe = 
nm 


n— +00 
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4. Là encore, il suffit d'étudier la suite (F (2 — 3) : 
n 


r(e-1)=r(re]-cs- À] 


1 
En notant À, = X " —00; T — = | ), on obtient une suite d'événements 


croissante pour l'inclusion, donc la suite de réels (P(4,)) converge et : 


+00 
nur? (Ü a.) 


P(XT(]— 00; x[)) = P(X < x) 


= Jim F(z- = 


n— +00 n 


F' a donc une limite à gauche en x, et : 


F(x) — Jim F(t) = P(X < x) — P(X < x) = P(X = x) 
Théorème 2.1 Toute fonction F : R — [0;1] telle que : 
1. F' est croissante 
2. im F(x) =0 et im PA} 
8. F' est continue à droite 


est la fonction de répartition d'une v.a.r. À. 


Ce théorème est admis. 
Propriété 2.5 La donnée de F' caractérise la loi de probabilité li. 


Démonstration : si on connaît F', alors : 
Va < y, ur; y]) = P(X Elx; y) = F(y) — F(x) 


On connaît donc y sur les parties du type |x;y|, et comme ces parties en- 
gendrent la tribu des boréliens BR (voir annexe 1), y est connue sur BR. 


Les v.a.r. au programme sont de deux types : 

les variables discrètes, lorsque X({) est fini ou dénombrable. Dans les cas 
usuels, X({) pourra s’écrire sous la forme {x;,i € I}, avec 1 = {1;...;n} 
ou Z = N, et la suite (x;) strictement croissante. F' sera alors constante sur 
chaque intervalle | — co; x1[, |x1; xl, … 

Les variables continues, lorsque F est continue et peut s’écrire sous la 
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T 


forme F'(x) = [l f(t)dt, où f est positive, d’intégrale sur R égale à 1 et 


discontinue sur un ensemble fini de points. 

Cependant, il existe des v.a.r. qui ne sont ni continues, ni discrètes. Par 
exemple, si X est égale au temps d’attente pour passer à un feu qui est vert 
30 secondes, puis orange et rouge 30 secondes, on a X(Q) = [0; 30] (donc 
X n’est pas discrète) et sa fonction de répartition vaut 0 sur | — co; 0[, puis 


0.5 + — sur [0; 30] et 1 sur [30; +oo[. X n’est donc pas non plus continue. 


II.4 - Vecteurs aléatoires 


Définition 2.5 On appelle vecteur aléatoire toute application : 


(2 — R” 
x: M 
WU | 
Xn(w) 


où les X; sont des variables aléatoires réelles. 


Exemple 2.6 On jette deux dés, et on pose ( = [1;6]°. 


nn. ( re ) 


est un vecteur aléatoire. 


On donne ensuite la définition générale de l’indépendance de variables 
aléatoires, qui sera caractérisée plus simplement dans les deux cas au pro- 
gramme : les variables discrètes et les variables à densité. 


Définition 2.6 Deux v.a.r. X et Y sont indépendantes si : 
V(B:; Bo) € (Br), P(X € B1NY € B>) = P(X € B:)P(Y € Bo) 
En particulier, pour tout couple (x; y) € R°, 
P(X €] - 00;x[NY €] — 00; y]) = P(X €] — 00; x])P(Y €] — 00; y]) 
On a la même définition pour n v.a.r. : 


Définition 2.7 Les v.a.r. X1,---,X, sont indépendantes si pour tout en- 
semble d'indices I inclus dans [1;n], on a, pour toute famille de boréliens 


(B; jier ‘ 


P(Nx E B,) = [[P(X € B;) 


icT iel 
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On étend la définition à une suite de variables aléatoires en considérant 
l'indépendance de toute sous-famille finie. 


II.5 - Enoncé des exercices 


Exercice 2.1 Retour sur les propriétés de F'. Soit F : R — R une fonction 
croissante. 


Î. 


Montrer que si lim F(x) existe, alors lim F(n) existe (et que les 
T—+00 n— +00 


deux limites sont égales !). Donner un contre-exemple dans le cas où F 
n’est pas monotone. 


Montrer que si F' est la fonction de répartition d’une v.a.r. À, alors : 


lim F(x) =1 


T— +00 


1 
Montrer que lim F(x) existe si et seulement si lim F(x0 + =) existe 
TT n+00 nm 


(et que les deux limites sont alors égales). C’est ce résultat qui a été 
utilisé pour démontrer la propriété sur la limite à droite d’une fonction 
de répartition. Donner un contre-exemple dans le cas où F' n'est pas 
monotone. 


Montrer que si F' est la fonction de répartition d’une v.a.r. À, alors 
l’ensemble de ses points de discontinuité est fini ou dénombrable. 


Exercice 2.2 Montrer que la loi de probabilité d’une v.a.r. X (l’applica- 
tion u) est une probabilité sur l’espace probabilisable (R; BR). 


Exercice 2.3 Soient X et Y deux v.a.r. de fonctions de répartition res- 
pectives F et G définies par : 


O0 si z <-I 
1 
F(x) = 3 si —1<x<2 
1 s tæ>2 
0 si z<0 
1 
G{(x) — x? si 0£z<; 
1 ei si > 1 
4 2 


1. Déterminer les réels x pour lesquels P(X = x) > 0 et les réels y pour 


lesquels P(Y = y) > 0. 
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2. Soit T = aX +b {a et b réels fixés, a > 0). Déterminer la fonction de 
répartition de T.. 


3. On suppose X et Y indépendantes, et on pose Z = max(X;Y}), U — 
min(X;Ÿ). Déterminer la fonction de répartition de Z ainsi que celle 
de U. 


Exercice 2.4 Soient F' une fonction de répartition continue et h un réel 
strictement positif fixé. Montrer que G définie par : 


1 z+h 
Vr ER, G(a) = > [l F(t)dt 
est une fonction de répartition. 


Exercice 2.5 Démontrer que Z est dénombrable et proposer une variable 
aléatoire dont la fonction de répartition F° a pour ensemble de points de 
discontinuité Z.. 


II.6G - Correction des exercices 
Exercice 2.1 


1. On vérifie tout d’abord que si la fonction F' tend vers ! en +co, alors la 
suite (F(n)) converge vers l : 


F(x) ave nd (Ve>0,34>0,xz > A=|F(x) -l|<e) 
T—} +00 
Soit N = E(A)+1:sin > N, alors n > À et donc |[F{n) — li] < €. 
Remarque : la croissance de F ne joue aucun rôle. 


Réciproquement : 


F(n) 1 (Ve > 0,3N EN n2N=T|F(n)-il<e) 


Soit zx > N : 

F' étant croissante, on a F(x) > F(N), et donc : F(x) >l—e. 

D'autre part, on a : x < E(x) + 1. Comme x > N, Ex) + 1 est un 
entier supérieur ou égal à NV, d’où : 


F(x) < F(E(x) +1) <i+e 


Conclusion : x > N = |F(x) —-i| <e, et donc : F(x) —— 1. 


xz— +00 
On a le même résultat si F' décroît. 
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Dans le cas où F n’est pas monotone, l’équivalence est fausse. On peut 
prendre par exemple F définie sur R par : 


F(x) = sin (2xx) 
La suite (F(n)) tend vers 0 et F n’a pas de limite (considérer la suite 
1 
(F (n + :)) par exemple). 


2. Si Fest la fonction de répartition d’une v.a.r. À, elle est croissante, 
donc il suffit de montrer que : 


F(n) ——5 1 


n— +00 


Par définition : F(n) = P(X €] - co;n]). 
La suite d'événements À, = X71(] — co; n]) est croissante pour l’inclu- 
sion donc la suite de réels (P(4,)) converge et : 


+00 
. … … _—] … … 
lim P(4r) = P(U mn = P(X-1(R)) = P(Q) = 1 
3. Il s’agit, comme à la question précédente, de manipuler la définition de 


la limite. Si la fonction F tend vers / à droite en %o : 


Ve > 0,1a > 0,x €lto; zo + a[= |[F(x) -1|<e 


1 1 1 
Soit N tel que — < a. Sin > N, alors — < à, donc to + = E]xo; &o + al. 
1 1 
Par conséquent, LF (20 + =) — ] < €, et donc la suite (F (z0 + =)) 


converge vers l. 


Remarque : la croissance de F' n'intervient pas. 


1 
Réciproquement, si la suite (F (20 + =)) converge vers | : 
1 
Ve>O0,2NENn>N—= IF (0 +=) - 1] < € 


Soit 4 +5 
OI Z L0; TO N : 


1 
comme Fest croissante, F(x) < F(xo + =), et donc F(x) <l+e. 


1 1 
Soit n tel que zo + = < x : comme Fest croissante, F (0 + =) < F(x). 


De plus, n > N (puisque to + = < ZT < Xo + N/ ce qui implique que 
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F(x0+ =) > l—e. On a donc F(x) >l—-e. 


Conclusion : 


L’équivalence est fausse si F' n’est pas monotone. 
Par exemple, F' définie par : 


0 si Zz<0 


io sin (7) si æ>0 
d 
1 
est telle que la suite (F(=)) tend vers 0 et la fonction F n’a pas de 


j 


limite en 0* (poser x — 
(P n+i 


. D’après les propriétés d’une fonction de répartition, F est discontinue 


en Zo Si et seulement si : 


lim F(x) — F(xo) > 0 
TS 
Ne 


hauteur du saut 


Soit D, l’ensemble des points où la hauteur du saut est supérieure 
1 1 

ou égale à — : D, — {20 ER/ lim F(x) — F(xo) > =h Comme Fest 
nm TTt nm 


croissante et comprise entre 0 et 1, la somme des hauteurs des sauts est 
inférieure ou égale à 1, donc D, comporte au plus n éléments. 
Soit D l’ensemble des points de discontinuité de F : 


+00 
D=\|)2, 
n=1 


D est donc une union dénombrable d’ensembles finis, et il est donc fini 
ou dénombrable. 


Exercice 2.2 

Pour montrer que y est une probabilité sur (R; BR), on vérifie les trois 
axlomes. 

Positivité : VB € Br, u(B) = P(X7'(B)) > 0. 

Totalité : !(R) = P(X ER) = P(Q) = 1. 
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Additivité : soit (B,) une suite d'éléments de Br deux à deux disjoints. 


(Ux.) = #((U5.)) 


| 
Le 
— 
ss 


Exercice 2.3 
1. On sait que pour tout x dans R : F(x) — Jim F(t) = P(X =x).Onen 
TL 
déduit immédiatement que P(X = —1) — 
Vx E R\{—1;2}, P(X = x) = 0. 
D'autre part, G étant continue sur R : VyEe R, P(Y = y) = 0. 


2. La fonction de répartition s'obtient directement à partir de celle de X : 


P(T<t) 


P(aX +b<t) 


MC r 


= F(—) 


si t<—-a+b 


si —a+b<t<2a+b 
si t>2a+b 


Il 
molle © 


3. On utilise l’indépendance de X et Y : 


P(Z<2) = P(X<2:2NY <2) 
P(X < 2)P(Y < 2) 


— F(2)G(2) 

0 st z<0 

1 

. s OÜ<z< L 

3 2 
_ 1 1 

s(1- Set) si 2 Ze 2 

3 
1 — CE si z>2 
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Pour la fonction de répartition de Ü, on passe à l'événement contraire : 


P(U <u) = 1-P(U>u) 
= 1-P(X>uNnY >u) 
= 1-P(X > u)P(Y > u) 
1—(1- F(u))(1 - G(u)) 


0 st u < —1 

1 

— s —l1<u<0 

; 2 

— 1—-(-u) si O<u< = 

1 1 

1—=ei , =<u<2 
5° si } <U< 

1 st 2<U 


Exercice 2.4 
Comme F est continue, G est dérivable, et : 


VreR,G'(x) = (F( + h) — F(x)) 


Comme F' est croissante, G” est positive, et donc G est croissante. 

De plus, G& étant dérivable, elle est continue, et en particulier continue à 
droite. 

Enfin, on a pour tout réel x : VE [x;x+h], F(x) < F(t) < F(x+h), ce 


qui implique (intégrer sur [x;x + h], puis multiplier par R) : 
F(x) < G(x) < F(x +h) 


En passant à la limite, il vient : lim G(x) =0 et lim G(z) = 1. 
T—} —O0 T—} +00 


G est donc bien une fonction de répartition. 


Exercice 2.5 
Il faut montrer que Z est en bijection avec N : l’application 


fine 2n—1 ss n>l 
| —2n ss n<0 


est une bijection de Z vers N. 

Il suffit ensuite de définir une variable aléatoire telle que X(Q) = Z, dont 
les poids de probabilité forment une famille sommable de somme égale à 
1. 

On peut poser par exemple : 


METZ, PX=n) = 
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On a bien : 
4 T° 1 
P(X — k=2 =—X—+—-— |] 
2 ( DE-LE nets 


et l’ensemble des points de discontinuité de la fonction de répartition de 
X est bien Z puisque : 


VrER,F(x)=P(X<z)= 9 P(X 


n<[x] 


(fonction en escalier). 


Chapitre III : Variables aléatoires discrètes 


III.1 - Définition 


Définition 3.1 Une v.a.r. X est dite discrète si X(Q) est fini ou dénom- 
brable. 


Un ensemble dénombrable est un ensemble en bijection avec N. X est donc 
discrète si X (92) est de la forme {x;,1 < à < n} (cas fini) ou de la forme 
{x;,i € N} (cas dénombrable). 


Remarque : Q est dénombrable, donc une v.ar. À qui prend toutes les 
valeurs de Q est discrète : ses valeurs ne sont donc pas nécessairement 
<« isolées >. 


Exemple 3.1 Une urne contient 3 boules rouges et 4 boules noires. On 
extrait successivement avec remise 2 boules de l’urne (on choisit comme 
univers Q = {R1; Ro; Rs; Ni; No; Ns; Na} et comme tribu À = P(Q)). On 
mise au départ 10 €, et on gagne 8 € par boule rouge obtenue. Soit X la 
v.a.r. prenant pour valeur le gain final. On a : X(Q) = {—10; —-2; +6}. 


Exemple 3.2 On considère le tournoi suivant : la première épreuve op- 
pose les joueurs Jo et J1, puis le vainqueur dispute la deuxième épreuve 
contre Ja, puis le vainqueur dispute la troisième épreuve contre Ja, et c. 
(Cf Capes 2006 épreuve 1...). Le tournoi s'arrête dès qu’un joueur a rem- 
porté deux duels consécutifs. Si X est la variable aléatoire égale au nombre 
de duels alors disputés, on a X(Q) = [2; +oo|. 


IIL.2 - Loi de probabilité 
Soit X une v.a.r. discrète, d’univers image X (0) = {x;,i € I} (où J est 
une partie de N). D’après la définition vue au chapitre précédent, il s’agit 


de déterminer l’application y : { si De (B)) : Or cette application 


est entièrement déterminée dès que l’on connaît (P(X = t;) ser. 

En effet, on a, par l’additivité de P : 

VB € Br,u(B) = P(X € B) = P( L) (X — n)) — ÿ_ P(X = x;) 
i/xæi€EB i/2:€B 


D'où la définition : 
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Définition 3.2 Donner la loi d’une v.a.r. discrète X, c’est donner X(Q), 
et pour tout x; € X(Q), la valeur de P(X = x;). 


Exemple 3.3 On reprend le jeu avec mise initiale de 10 €. On suppose 
les boules indiscernables au toucher et on choisit pour P la probabilité 
uniforme. À a pour loi : 


LOMBUEILE 
16 | 24/19 


Propriété 3.1 Puisque P vérifie l’axiome de totalité, on a évidemment : 


> PO) = 1 


icl 


Démonstration : il suffit d'écrire que les événements X71({x;}),i € I, 
sont disjoints et que leur réunion est égale à (2. 


Remarque : ne pas confondre la probabilité P, qui a été installée sur 
l’espace probabilisable ((; 4) et la probabilité u, qui est la loi de X. 

Par exemple, pour le jeu avec mise initiale de 10 €, P est uniforme et y 
ne l’est pas. 


Propriété 3.2 Soit I une partie non vide de N. 
La donnée de deux familles de réels (ti)ier et (Diier tels que : 


iel 
permet de définir la loi de probabilité d’une v.a.r. discrète X en posant : 


Démonstration : X est bien discrète puisque Z est une partie non vide 
de N, et on vérifie que : 


. J Br — (0;1] 
Br P(X7(B)) 


est une probabilité. 


Dans le cas où Î n’est pas finie, la condition 2 est que la famille (y;) 
soit sommable, de somme 1, ce qui équivaut à la convergence de la série 
d pi vers 1, puisque les p; sont positifs (voir annexe 2). 

Rappel : dans le cas d’une suite de réels quelconques (u,), la sommabilité 
de la famille équivaut à la convergence absolue de la série. 


Espérance 05 
Exemple 3.4 Soit X d’univers image X(Q) = N telle que 


VneN,P(X =n)=e 


On a bien la positivité des P(X ) et > rx P(X 


(Vérifiez que vous savez montrer la convergence de la série, et le fait que 
sa somme vaut 1..). 


IIL.3 - Fonction de répartition 


Comme on l’a vu au chapitre précédent, c’est la fonction : 


.j R—1{0:1] 
TEE 


Dans le cas où X prend des valeurs ordonnées %1 < %2 < -::, la fonction 
Fest alors constante sur chaque intervalle |x;; z;,1|[ : on a une fonction en 
escalier. 

En effet, si on considère deux réels x et y tels que x; < x < y < T;41, on 
à : 


F(y) — F(x) = P(X €lx; y]) = P(D) = 0 
Exemple 3.5 Si on reprend le jeu avec mise initiale de 10 €, on obtient : 


O0 si x <]10 


16 st —10 < x < —2 
49 
F(x) = 10 
— si —2< 
19 si <zT<6 
1 ss 6<7%x 


IIT.4 - Espérance 


Il s’agit de la moyenne des valeurs de À pondérées par leur probabilité 
d'apparition : 


Définition 3.3 Soit X une v.a.r. discrète. 
On appelle espérance de X le réel, noté E(X) : 
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lorsque X(Q) = {x1;--:; Zn}, Ou : 


E(X) = >_,mP(X = %;) 


i=1 


lorsque X(Q) = {x;;i > 1} et que cette série est absolument convergente. 


Dans ce dernier cas, on ne peut pas exiger seulement la convergence de 
la série : on veut définir l’espérance de X indépendamment de la façon 
dont on a numéroté X(() (c’est-à-dire indépendamment de la bijection : 
N — X(()). On exige donc la convergence commutative de la série, ce 
qui équivaut à son absolue convergence, ou encore à la sommabilité de la 
famille (x; P(X = x;));en (voir annexe 2). 


Remarque : dans le premier cas, lorsque X (Q) est fini, E(X) est donc le 
barycentre de la famille de points pondérés (x; P(X = t;));=1.. n°. 


Exemple 3.6 En reprenant le jeu des 10 €, 


16 24 9 29 
B(X) = (—10) x 2 +(-2)x D +6x = 


n 


2 
Exemple 3.7 Soit X de loi: X(Q)=N etVWneN,P(X =n) — TE 


La série Ÿ nP(X — n) est convergente (utiliser par exemple la règle de 
n>0 


D’Alembert), donc E(X) existe, et : 


+00 +00 on +00 on 
nP(X=n)=) ne ?—=e?N > —e"?x 12e —2 
> I CEL 
6 
r2n2 


Exemple 3.8 Soit X de loi X(Q) = N° et Vne N',P(X =n)— 


. . . ’ , # Q 1 
La définition de la loi est cohérente, puisque la série ) —> CONVETJE vers 
n 
n>1 
2 
TK / 3 . A 7 . 
6 (ce résultat peut s’obtenir par exemple grâce aux séries de Fourier, en 


développant la fonction f : R — R, 2x périodique et telle que : 


72 
Vz e[-r;x], f(x) = 1— 2) 
puis en appliquant le théorème de Dirichlet en x = 7). 


| 6 
Comme la série Ÿ nP(X — n) a son terme général égal à ——, elle di- 
n>1 mn 
verge et À n'a donc pas d’espérance. 
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Propriété 3.3 Si X(Q) possède un maximum et un minimum, alors E(X) 
existe et : 


Lmin < E(X) < Tmazx 


Démonstration : dans le cas dénombrable : soit M = max(|tminl; |(Tmaxl). 
On a pour tout 1, |x;| < M, donc la série à termes positifs ) pilmil a ses 


i>0 
+00 

sommes partielles majorées par la constante S piM — M. Elle est donc 
i=0 


convergente, et E(X) existe. De plus : 


Vi E N,Tmin < Ti < Tmax 


+00 +00 +00 
> Ÿ Pitmin < Ÿ ir: < Ÿ Ditmaz 


i=0 i=0 i=0 
+00 

D'où l’encadrement souhaité (puisque ÿ Di = 1). 
i=0 


Même démarche dans le cas fini. 


Théorème 3.1 Sï (2 est fini ou dénombrable, alors : 


= > X(w)P({w}) 


we 


sous réserve de convergence absolue. 


Ce théorème est essentiel car il permet de montrer facilement la linéarité de 
l'opérateur Æ, ce qui n’a rien d’évident avec les formules de la définition. 
De plus, il permet de faire le lien avec la théorie de la mesure, où l’on 


écrirait : 
— | X dP 
a 
Démonstration : on note : À; = {w € (/X{(w) = x;}. Alors : 


P(X = x) = P(XT ({xi})) = = >, P({w}) 


wE À; 
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On obtient donc : 


2 mP(X = Ti) — 2x 2, PA) 


WE À; 


s ÿ ti P({w}) 


i wEA; 


SN X(w) P({w}) car w € À; = X(w) = x; 


i WwWEA; 


Ÿ_X(w)P( ({w}) car UA = = ( 


we 


Ce résultat a peu d'intérêt pour le calcul pratique de l’espérance : dans le 
cas du jeu des 10 €, on a une somme de 49 termes, au lieu d’une somme 
de 3 termes si l’on utilise directement la définition. Par contre, il permet 
de démontrer : 


Propriété 3.4 Soient X et Y deux v.a.r. discrètes sur {1 qui possèdent 
une espérance, et soit À € KR. 
Alors X + ÀŸY est une v.a.r. discrète sur {1 qui possède une espérance, et : 


E(X + \Y) = E(X) +)E(Y) 


Autrement dit, l’opérateur E est une forme linéaire sur l’espace vectoriel 
des v.a.r. discrètes sur { d’espérance finie. 


Démonstration : la série SX (w)+AY (w))P({w}) est absolument con- 


WE 
vergente comme somme de deux séries absolument convergentes, et on peut 


séparer la somme en deux (puisque chacune a bien un sens) : 


D(XG) +7 (W))P({u}) = D X(W)P({u}) + AD Y(w)P({w}) 
WE? WE WE 


E(X) + X\E(Y) 


La démonstration qui précède nécessite que {? soit fini ou dénombrable, 
sinon l'indexation du symbole ÿ n’a plus de sens. 

Le résultat (linéarité de l’espérance) reste vrai même si ( n’est ni fini, ni 
dénombrable. 

L'idée est de décomposer canoniquement les v.a.r. discrètes comme com- 
binaison de fonctions caractéristiques. On note : 


À (Q) 
et À; 


{x;;i € TI}, où JT est une partie finie ou dénombrable de N, 


Ww/X(w) = x} 


Composition par une fonction 59 


On a alors la décomposition de X : X — Ÿ BL. 

Le membre de droite est une série de Rio qui converge simplement 
vers la fonction X, puisque si l’on fixe w € (1, alors w appartient à un et 
un seul des À;, et la somme ne comporte donc qu’un terme, qui vaut t:;, 
c’est-à-dire X(w). 

On a par définition de l’espérance : 


E(X) = D mi P(X = œ5) = Ÿ x;P(A;) 


ieI ieI 
On décompose également Y : Y — D» Y;18,. On obtient alors une décom- 


jeJ 
position de À + Y : 


X+Y — Ÿ (Ti + Y5)L ans, 


1€cl;j€J 


En effet : Vw € (,11(1; j)/w € À; et w € B;, et on a alors bien : 


(X+Y)W)=m+y= D (ti+y)lans,(w) 


1€l;j€eJ 
D’après la décomposition que l’on vient d’obtenir : 


E(X + Y) — d (x + y;)P(A; MN B;) 


> ,mP(Ai) LA >_w5P(B;) 


= E(X)+E(Y) 


IIL.5 - Composition par une fonction 

On considère une v.a.r. X discrète, d’univers image X (0) = {x;;i € I} où 
I est une partie non vide de N, et g une fonction continue par morceaux 
définie sur un intervalle J contenant X(Q(). Alors go X(Q) = {g(x;);1e 1} 
est fini ou dénombrable, donc g o X est une v.a.r. discrète (on savait que 
c'était une variable aléatoire réelle par la propriété 2.3). 
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Le résultat le plus important est le théorème de transfert : 


Théorème 3.2 Sous les hypothèses précédentes, on a : 


B((X)) = Xa(e)P(X = 2) 


sous réserve de convergence absolue. 


Démonstration : on note À; — {w € (/X{(w) = ti}. Dans le cas où 
est fini ou dénombrable, on a directement, sous réserve de convergence 
absolue : 


S_g(X(w))P({w}) 


wen 


D) g(:)P({w}) 


1 WwWEA; 


= 295) Ÿ_ P{w}) 


WE À; 


, g(x:)P 


Dans le cas général, on utilise, comme pour la linéarité de l’espérance, la 
décomposition de X : X — Ù z;l4,. On a alors une décomposition de 


E(g(X)) 


Il 


î 
g(X) (qui n’est pas nécessairement « canonique >», car les g(x;) ne sont pas 
nécessairement distincts) : 
> 9 (ti) l4; 
î 


et donc : E(g 2 g(xi)P 


Exemple 3.9 En reprenant le jeu des 10 € : 
16 224 2, 9 2020 


ARRET (EE =. ee 
E(X*) = ( ES 2) TL TT 


IIL.6 - Variance et écart-type 


Définition 3.4 On appelle moment d'ordre 2 de X l’espérance, si elle 
existe, de la variable X°. 
D'après le théorème de ES c’est donc le réel, s’il existe : 


PEL =) 
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Définition 3.5 On appelle variance de X l’espérance, si elle existe, de la 
variable (X — E(X))° : 


V(X) = E((X — E(X))°) 
C’est donc le réel, sous réserve d'existence : 


E((X — E(X)Ÿ) = D (œi - E(X)ŸP(X = x) 


4 


La variance est aussi appelée moment centré d'ordre 2. 


Remarque : son existence suppose en particulier celle de E(X). 

On mesure la somme des carrés des écarts entre les valeurs de X et la 
moyenne, pondérés par les poids de probabilité. C’est donc un indicateur 
de « dispersion > autour de E(X). 


Propriété 3.5 Si X admet une variance, alors : 
1. V(X)>0 
2. V(X)=0& X est constante 


En effet : V(X) = 0 = Vi,(x; — E(X))*P(X = x) = 0. On a donc que 
tous les x; sont égaux (à E(X)). (En toute rigueur, c’est le cas sauf lorsque 
P(X = x;) = 0, c’est-à-dire hors d’un ensemble de mesure nulle : X est 
donc constante < presque partout >). 


Propriété 3.6 X admet une variance si et seulement si À admet un mo- 
ment d'ordre 2. 


Démonstration : il n’y a pas de problème d'existence si X((2) est fini. 
Si X(N) est dénombrable : l'existence d’une variance suppose par définition 
celle de E(X), et l'existence de E(X?) implique celle de E(X) (essayez de 
le démontrer, voir exercice 3.5 si difficulté). 

Soit N > 1. On a : 


Di — E(X)Pp: = Jap; — 2E(X) Ÿ_ mipi + (E(X)) 


On en déduit l’équivalence entre la convergence de la série 2 x?p, et celle 


de ÿ (x: E(X)}n: . | 


i>l 
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Le calcul pratique se fait souvent avec la formule de Koenig-Huygens : 


Théorème 3.3 Si X possède une variance, alors : 
V(X) = E(X°?) - (E(X)) 


> mP(x = Ti) — 2 DPIX = )) 


On obtient donc la variance en calculant <« la moyenne des carrés moins le 
carré de la moyenne >. 
Démonstration : on utilise la linéarité de l’espérance : 


V(X) = E(X-E(X)) 
= E(X?-2XE(X)+(E(X))) 
= E(X?) - 2E(X)E(X) + (E(X)) 
= E(X?) - (E(X)) 


Exemple 3.10 Pour le jeu des 10 €, on obtient : 


ee 2 
LE (5 = 31.35 


VOX) = (107 x toy x É46 x : 


49 49 49 


Propriété 3.7 Soit (a;b) € R°. Si X possède une variance, alors la v.a.r. 
aX + b possède une variance et : 


V(aX + b) = a V(X) 


Démonstration : il faut vérifier que la variable (aX + b — E(aX + b)) 
possède une espérance. 
Or, par linéarité de E : 


(aX +b— E(aX +b))° = (aX +b—aE(X) — b)? = a (X — E(X)) 


Puisque X possède une variance, on a par définition l'existence de l’espé- 
rance de la variable (X—E(X))°, et donc celle de la variable a°(X—E(X))°. 
On a immédiatement : 


V(aX +b) = E(a(X — E(X)}) 
— a E(X - E(X)) 
a°V(X) 


Définition 3.6 On appelle, lorsque X admet une variance, écart-type de 
X le réel : 
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Définition 3.7 On appelle variable centrée toute variable X telle que : 
E(X) = 0, et variable réduite toute variable X telle que : V(X) = 1. 


Exemple 3.11 La variable X — E(X) est centrée et la variable À 
O 


est réduite. 


Définition 3.8 On appelle moment d'ordre k l’espérance, si elle existe, 
de la v.a.r. XF, c'est-à-dire, d’après le théorème de transfert : 


E(XF) = 2 P(X = x;) 


Remarque : si X(() est fini, alors X possède des moments de tout ordre. 
Dans le cas où X(() est dénombrable, l’existence du moment d’ordre k 


suppose par définition la convergence absolue de la série > x P(X = x), 
iEN 

et on a la propriété : 

Propriété 3.8 Si À possède un moment d’ordre k, alors tous ses mo- 

ments d’ordre k' < k existent. 


Démonstration : voir exercice 3.5. 


III.7 - Enoncé des exercices 


Exercice 3.1 Soit ((; 4; P) un espace probabilisé. 
1. Soit un événement À : montrer que P(A) = E(14), où 14 est l’indica- 
trice de À. 
Cette égalité sera notamment à la base de la démonstration de l'inégalité 
de Bienaymé-Tchebycheu. 
2. Écrire 1 AUB, Lang et 1x en fonction de 14 et 13. 
3. Démonstration de la formule de Poincaré : on considère n événements 
Asus À 
i Écrire 1 Au-.uA, en fonction des indicatrices des À;. 
ji Soit Q un polynôme unitaire à coefficients réels de degré n : 
Q(X) = X° + an Xl + an-2X 7 +. + ao 


On note a1,--:,a, ses racines (éventuellement complexes, non né- 
cessairement distinctes) et o1,:°:,0A les fonctions symétriques élé- 
mentaires des racines, c’est-à-dire : 


VkE [l;n], ox = ) ii Dig *** Oz 
1<in ciao cr <ig En 


Développer (X — a):::(X — a.) en faisant apparaître les 04. 
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ii Démontrer alors la formule de Poincaré. 


Exercice 3.2 Soit f définie sur N° par : 
4 
n(n + 1)(n +2) 
Vérifier que f est la distribution de probabilité d’une v.a.r. X à valeurs 


dans N* {telle que : Vn € N*, P(X = n) = f(n)), et calculer lorsque c’est 
possible l’espérance et la variance de X. 


Vn > 0, f(n) = 


Exercice 3.3 Soit X la v.a.r. prenant pour valeurs les entiers naturels 
congrus à 0 ou 1 modulo 3, et dont la loi de probabilité est donnée par : 


Vn e X(Q),P(X =n) = a3 ” 
1. Calculer a. 


2. Calculer, lorsque c’est possible, l’espérance et la variance de X. 


Exercice 3.4 Soit X une variable aléatoire dans N. On note F' sa fonction 
de répartition et on suppose que E(X) existe. 


1. Montrer que : n(1 — F(n)) see 0. 


2. Cela suffit-il à assurer la convergence de la série d (1 — F(n)) ? 


n>0 


1 
Un = o(=) > Su converge ? 


n>0 


c’est-à-dire : 


3. Démontrer que 1 — F(n) est le terme général d’une série convergente, 
dont la somme est égale à E(X). 


Exercice 3.5 1. Montrer que si une v.a.r. discrète possède un moment 
d'ordre 2, alors elle possède un moment d’ordre 1. 

2. De manière générale, montrer que si une v.a.r. discrète admet un mo- 
ment d'ordre k, alors elle admet des moments d'ordre k' pour tout 
k'<Kk. 


Exercice 3.6 1. Soit f définie sur R, 27-périodique, paire et telle que : 
Vx € lo; x], f(x) = cosh x 


Déterminer la série de Fourier de f, étudier sa convergence et donner 
+00 
À nn 1 
sa somme, puis en déduire la valeur de Ù a 
n 


n=0 
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2. Soit À une v.a.r. dont la loi est donnée par : 
X(QO)=N et VnEeN PIX =n) = — 


Déterminer a. X admet-elle une espérance ? 


Exercice 3.7 k urnes contiennent chacune n boules indiscernables au tou- 
cher numérotées de 1 à n. On prélève une boule dans chaque urne, et on 
appelle X, la v.a.r. égale au plus grand des numéros obtenus. 


1. Déterminer (1. 
On choisit comme tribu À = P(Q) et comme probabilité P la probabilité 
uniforme. 


. Préciser X(Q) et calculer P(X = 1). 
. Calculer, pour h € X(Q), P(X, < h). 
En déduire, pour h € X(Q), P(X, = h). 


Déterminer un équivalent de E(X,) lorsque n tend vers +o (k fixé) 
(on ne cherchera pas à calculer explicitement E(X,)). 
Indication : faire apparaître une somme de Riemann. 


a à % 1 


Exercice 3.8 Soit X une v.a.r. discrète admettant un moment d’ordre 2. 
Déterminer le minimum de la fonction : 


R — KR 
‘la + E((X-a)) 
Interpréter le résultat. 


Exercice 3.9 Une urne est composée de 6 boules indiscernables au tou- 
cher portant les numéros suivants : 0, 1, 1, 2, 2 et 4. On tire une poignée 
de n boules et on appelle X, le produit des numéros obtenus. 

1. Déterminer, pour n € [1;6], un espace probabilisé ({n; An; Ph). 

2. Déterminer les lois de X1,...,X6. 


3. Si l’on veut maximiser le produit obtenu, combien vaut-il mieux tirer de 
boules ? 


Exercice 3.10 Une urne contient n + 1 boules indiscernables au toucher 
numérotées comme suit : 1, 1, 2, 3, 4, .…, n. On tire une poignée de N 
boules et on appelle S la somme des N numéros obtenus. 


1. Définir ({; 4; P). 
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2. Soit X} la variable définie par : 


k si le numéro k est dans la poignée 
DC — 
O0 sinon 


Déterminer la loi de X4. 
3. Exprimer S en fonction des X4 et en déduire E(S). 


III.8 - Correction des exercices 
Exercice 3.1 
1. On a 14(Q) = {0;1}, et : 


P(La = 1) = P({w/Ta(w) = 1}) = P({w/w € Aï) = P(A) 
D'où : E(14) = 0 x (1 — P(A)) +1 x P(A) = P(À). 


2. On vérifie facilement que Lang = 148, laug = 14 + 18 — lalp, et 
que 13 = 1 — 14. 
3. i d’après la question précédente : 


LA, UuA, — 1 — 1.4 D 1 (1 er 14,) id: (1 ue 14.) 


ii On développe : 


(X— om) (X- an) = X"+ XI (on — .. — y) 
EXT (aa + +: Qn-1Qn) ++: 
+(—1)"a a 
= XV + XT (01) + X (02) +. 
Hs 


Remarque : on retrouve en particulier les relations entre coeffi- 
cients du polynôme et fonctions symétriques élémentaires des ra- 
Cines : 


VkE [0; n], Ak — (—1)7 0,4 
iii On a donc l'identité algébrique suivante : 
(1—@)::-(1—an)=1-01+02—03::+(—-1)"o 


En posant : Vk € [0;n], 6x — ÿ 14, *:-14,,, on obtient : 


1<Li1 << <iE SN 


1—(1—-14,):.:(1—14,) = 01-02 +03+:..(—1)715, 
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Par linéarité de l’espérance : 


E(lau.u4,) = E(ô1) — E(ü2) + E(63) +...(—1)" E(G,) 
= P(A;)+:.:+P(4,) 


ce qui est la formule de Poincaré, puisque : 
E(Lau..uA.) — P(A: U-.:.UÙ An) 


Suggestion : pour bien voir l'intérêt des fonctions caractéristiques, vous 
pouvez regarder l'exercice d’algèbre suivant : soit E un ensemble non vide. 
On munit P(E) de la loi À, appelée différence symétrique, définie par : 


V(A;B) € (P(E))ÿ, AAB = (ANB)U(ANEB) 
Question : (P(E); À) est-il un groupe ? 


Pour l’associativité, vous verrez vite l’intérêt des fonctions caractéristiques 
(commencer par exprimer 1448 en fonction de 14 et 15)! 


Exercice 3.2 
La série >» f(n) est à termes positifs. Il reste à vérifier qu’elle converge vers 


n>1 
4 
1. Elle est convergente puisque f(n) Vo Pour calculer sa somme, on 
n— +00 
décompose f(n) en éléments simples : 
Dress * D-rtre) 
4 nn +1)(n +2) _ Æi\n n+l n+2 
Vi À 1 U 1 
DE Dit D 
N N+1, N+2 ; 
= 25,--43,=+2) > 
n=1l n=2 n=3 
1 1 1 
_ = -4(S -.) 
21+5) 4647 
H( Lo, ) 
N+1 N+2 
1 


N—+oo 
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Attention à bien prendre des sommes partielles pour le calcul, sinon vous 
écrivez une série convergente comme somme de trois séries divergentes. 


Remarque : dans la décomposition en éléments simples : 


4 a b C 


a 
nin+l)(n+2) n n+1 n+2 


la somme des poids a + b + c est nécessairement nulle (multiplier par n 
et faire tendre n vers +oo), ce qui permet de simplifier le calcul de la 
somme partielle. C’est le cas pour toutes les séries dont le terme général 
est une fraction avec des pôles simples au dénominateur et une constante 
au numérateur. 


Conclusion : la suite (f(n)) est la distribution de probabilité d’une v.a.r. 
X (X(Q) = N' et P(X = n) = f(n)). 


n— +00 
gence de la série Sn f(n). On calcule E(X) encore en décomposant en 
n>1 
éléments simples : 


| 4 
X possède une espérance puisque nf(n) ml ce qui assure la conver- 


a 1 
12 mrDG+2 
L SU 1 1 ) 
_ — n+il n+2 


1 1 
- G-r 
2 N+2 


N—+00 


S nP(X=n) 


. 4 | 
Par contre, X ne possède pas de variance puisque n° f (n) 7 —,ce qui 
n—+00 7 


entraîne la divergence de la série Sn f(n). (E(X*) n'existe pas). 
n>1 
Exercice 3.3 
Les réels P(X = n) doivent être positifs, donc & > 0. 
La série > P(X = n) est à termes positifs, et toutes ses sommes par- 


neX(N) 
+00 
: 2 a 1 :. 
tielles sont majorées par la constante >. D @ TE La série est donc 
n=0 1 — —- 


3 
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convergente. Sa somme doit être égale à 1 : 


+00 i 


D» P(X LUE + pr) - a(——)-25 


nexX(Q) 27 


On pose donc a — T 
L'espérance de X existe si et seulement si la série 3 nP(X = n) con- 
neX(Q) 


verge. C’est le cas puisque c’est une série à termes positifs dont les sommes 
+00 


—— 13 n 
partielles sont toutes majorées par la constante : 18 4 n(à) (cette 


somme est bien finie, par exemple par la règle de D’ Alembert, ou comme 


dérivée de la série entière de rayon 1 ) x”, en T = =). 
3 
n>0 
Le calcul de l’espérance utilise la série géométrique dérivée une fois : 


Ma 11 En = 


On décompose : 


+00 +00 


13 1 1 
D nP(X=n) = (Ds + D USk+1)) 
nexX() k=0 k=0 
+00 +00 
1 \k-1 1 1 \k-1 
” HE r) +721) 
k=0 k=0 
1 +00 1 k 
He) 
3 2 \27 
__ 13 ( 4,1 . 1, 1 ) _ 19 
_ 18\27 (1-2) 3 1-27 52 


Pour la variance, E(X°) existe car les sommes partielles de la .: à termes 


positifs 3 n'P(X = n) sont majorées par la constante > (2) 
neX(Q) 

et le calcul se fait en écrivant n° = n(n — 1) +n et utilisant à. séries 

géométriques dérivées. 
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Exercice 3.4 


1. 


On majore n{(1 — F'(n)) : 


n(l1-F(n)) = nP(X >n) 
+00 
= n > P(X=k) 
k=n+1 
+00 
< » KP(X = k) —— 0 


(reste d’une série convergente). 


. La condition (nu,) converge vers 0 n’est pas suffisante. On considère la 


Q 1 . . ? + lé # 
série ÿ ne (elle fait partie d’un ensemble de séries appelées séries 
>2 


1 
de Bertrand). On a bien : — o(=), mais la série diverge; on le 
ninn n 


montre avec le théorème de comparaison séries-intégrales : la fonction 


ns — R 
9 : 1 


t H  _—— 
tint 


est positive, continue et décroissante. 
+00 


La série >. g(n) et l’intégrale | g(t)dt sont donc de même nature. 
n>2 2 
Or l'intégrale est divergente : soit x > 2. On a, en intégrant directement : 


— dt  — | dt 
9 tint 2 Int 


[fn (Int)f 
—  In(Inx)—-In(In2) 


——— +00 
T—}+00 


La série est donc également divergente. 


Remarque : pour une question beaucoup plus simple sur les suites, 
vous pouvez vérifier que Nnun —— 0 = y ——— 0, et que la récipro- 
n— +00 n—++00 


que est fausse. 
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3. Soit N > 0: 
> (-—F(n)) 
= Ÿ_P(X > n) 


= PX =) PX=N+DEPXS NE 
+P(X =2)+...P(X=N+1)+P(X > N+1) 
+P(X =3)+...P(X=N+1)+P(X>N+1) 
+... +P(X=N+1)+P(X > N +1) 

=  J nP(X=n)+(N+1)P(X>N +1) 


n=i1 


N—+00 


——— ÿ nP(X=n)(=E(X) 


car on a montré à la première question que NP(X > N) Feu 0. 
—++00 


Exercice 3.5 
1. On suppose que Ÿ xp converge. On a l'inégalité : 
i>1 


VrER,Iix| <z° +1 


Comme les séries Ù x?p; et Ù p; sont convergentes, la série ) x; |D; 
i>1 i>1 i>1 

converge, en vertu du théorème de comparaison pour les séries à termes 
positifs. 

2. On a l'inégalité suivante : Vx ER, |rl*"* < |x|* + 1 (distinguer les cas 
x] > 1 et [x] < 1). Comme Ù x:|Fp, et ) p: sont convergentes, 

i>1 i>1 
le théorème de comparaison pour les séries à termes positifs assure la 
convergence de ) t:[*"1p;. Par récurrence finie, on obtient bien que 
i>1 

pour tout k’ inférieur ou égal à k, X possède un moment d’ordre k!. 


Exercice 3.6 


1. f étant paire, les coefficients b, sont tous nuls. 
Calcul des coefficients à, : 


1 jf” 2 dE 
Vn>1l,an — — | cosh t cos(nt)dt = — [l cosh t cos(nt)dt 
TT T J0 


A 
Le, ne” 
I 
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On calcule Z par exemple en effectuant une double intégration par par- 
ties : 


I = — | sinh tsin(nt)dt 
mn Jo 


t LT L 
Re ut | cogh + CE) à 
n nm n 0 n 


(—1)"sinhr 1 


SR 
D'ù:r- (sine, _2C1)"snhr 
A + 1 f : n? + 1 
D'autre part : D | cosh tdt — — —, D'où la série de Fourier de j : 
TJ» 


sinh 2(—1)"sinhr 
—_—_——— + 2 CNT cos(nx) 


Comme f est C! par morceaux, le théorème de Dirichlet s’applique 


. | 2) + f(x* 
(la série de Fourier de f converge pour tout x vers fa) +77), et 
comme f est continue, sa série de Fourier converge en tout point x vers 


f(x) : 


_ sinhr T —_ 2 ( )*sinh 7 
ee — 2 cos(nzx) 
JT n LT | 


Vz ER, f(x) 


Pour xt = 7 : 
+00 : 
1 sinh 7 T T 1 
 — _ = | 
2 1+n2 (F(r) T Eee 2 re 2 


Conclusion : 


+00 
S = Toothr + à 
=” on 2 2 2 


. La série Ÿ_ P(X — n) doit être convergente et de somme 1, donc on 


n>0 
pose : 


2 
 xcothr +1 


La variable X ne possède pas d'espérance car nP(X = n) = _. ce qui 
n 


entraîne la divergence de la série ÿ_ nP(X = n). 
n>0 
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Exercice 3.7 


1. On pose comme univers : { = [1;n]". 


2. On a X,(Q) = [ln], et : P(X, = 1) = P({(L:-.-;n)}) 


3. Soit h € [l; nl] : 


PERS P U CCD) 


1<a1<h,.,1<ax;<h 
= P([hl") 
Card([1: A]#) 
Card {2 


4. On en déduit : 


P(Xr=h) = P(Xh<h)-P(Xr <h—1) 
h* (h—1)" 
né nm 


grâce aux sommes de Riemann : 


E(X,) = hP(X =h) 


n Rk+1 n—1 


= D-Su+02 


13 


. On obtient alors un équivalent, lorsque n tend vers +00, de l’espérance 
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Exercice 3.8 
p(a) = E(X? — 2aX + a) = E(X?) — 2aE(X) + a 


® est donc minimale en a = E(X). 

L’espérance est donc la meilleure approximation de À par une constante 
au sens des moindres carrés. En termes d’algèbre bilinéaire, E(X) est le 
projeté orthogonal de X sur la droite Vect{1}, au sens du produit scalaire 
(X;Y)+ E(XY). 


Exercice 3.9 

Soit E = {0;1;1;2;2;4}. 

1. On pose, pour n € [1;6] : 0, = {A C P(E)/ Card À = n}. On choisit 
An = P(Q;), et comme les poignées sont équiprobables (n est fixé), on 
prend comme probabilité P, la probabilité uniforme. 


2. Le calcul des poids de probabilité se réduit à du dénombrement puisque 


6 
P, est uniforme. On a Card {?, — , et on obtient : 
n 


X(%)]/0/1/2/4 


X(%)| 01/1/2478 


NÉE RE 
15 | 15 | 15 | 15 | 15 


1f2{2{1 

6161616 
ETOIRIENENERE 

10 = 1 
BMÉÉERE 
ACIDE 

ss) 


616 


3. On compare les espérances : 
Ô 37 16 
FE X "= ŒÆ= — = —— 
(X:) s” “us 1 , E(X3) 5 
E(X4) — , E(X5) = —R— = EUX) = — 0 


Il vaut donc mieux tirer une poignée de 4 boules (espérance la plus 
élevée). 

Exercice 3.10 

Soit E = {1;1;2;3;--.;5n}. 


1. On pose {2 = {A C P(E)/ Card À = N}, À = P(Q) et on prend pour 
P la probabilité uniforme. 
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2SR =]: 


Card(X,"({0})) 

Card (2 
a) (n+1-Nj(n-N) 
(x) n(n +1) 


_(R+i-N)(n— 
n(n + 1) 


Même raisonnement si : el: 


P(X, = 0) = SE AO _ mur : 


D'où la loi de X} : 


n 


3. On a S — ÿ X4, et par linéarité de l’espérance : 


E(s) = SE(X) 
: (n+i-N\n-N) N 
oo n(n +1) DIE 
: _@tIi=N)R=N), Nn 


n(n + 1) 2 


15 


Chapitre IV : Lois discrètes usuelles 


Il s'agit de passer en revue les lois discrètes usuelles du programme, en 
donnant pour chacune d’elles l’univers image, les poids de probabilité, 
l'espérance et la variance, ainsi que le contexte classique où on les ren- 
contre. 


IV.1 - Loi uniforme sur [1;n|] 


Définition 4.1 X suit la loi uniforme sur [1;n] si : 
1. X(Q) = [ln] 

2. Vie [1], P(X = à) = | 

On note alors : X © U([1;n]). 


Il s’agit simplement, comme son nom l'indique, d’une loi dont tous les 
poids de probabilité sont identiques. 


1 227 
Propriété 4.1 E(X) = = et V(X) = — 
Démonstration : 
1 1. 1 nn+1) n+1 
EX = — = — = — = — 
(X) 2x, n 22° n |” 2 2 


Commentaire : sachez redémontrer la valeur de la somme des n premiers 
entiers (écrire la somme une fois dans un sens et une fois dans l’autre...). 


Remarque : comme les poids sont tous égaux, l’espérance est l’isoba- 


rycentre des entiers de 1 à n, et vaut donc bien 


Pour la variance : 


o _ o 1 1 nin+l)(2n +1 n+1)(2n +1 
D) = DIE x ne + Dn +1 


puis V(X) = E(X?) — (E(X)). 
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Commentaire : la valeur de la somme des carrés des n premiers en- 
tiers est une bonne application de la formule du binôme (leçon sur les 
combinaisons). 


IV.2 - Loi de Bernoulli 


Définition 4.2 Soit p € [0,1]. X suit la loi de Bernoulli de paramètre p 
S1 : 


1. X(Q) = {0;1} 
2. P(X=0)=1-pet P(X =1)=9? 
On note alors : X + B(p). 


Contexte usuel : on considère un espace probabilisé ({; 4; P) et on s’inté- 
resse à un événement S, appelé « succès >». 
On définit alors une v.a.r. 


1siwesS 


x iur | , 
0 sinon 


X est donc simplement l’indicatrice du succès S, et si on note p = P(S), 
X suit une loi de Bernoulli de paramètre p. 


Propriété 4.2 E(X) = p et V(X) = p(1 — p) 
Remarque : les calculs des moments de X sont facilités par le fait que : 


Va eV = X 
IV.3 - Loi binomiale 


Définition 4.3 Soient n € N° et p € [0;1]. X suit la loi binomiale de 
paramètres n et p si : 


1. X(Q) = [ü;n] 
2. Vk E [0;n], P(X = k) — ; )#*0 — pr 


On note alors : X = B{n; p). 


Contexte usuel : comme pour la loi de Bernoulli, on considère une expérien- 
ce aléatoire modélisée par un espace probabilisé (Q; 4; P) et on s'intéresse 
à un événement S. 
On note p = P(S),. 
On répète n fois cette expérience aléatoire de manière « indépendante >», 
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c’est-à-dire que l’on munit l’espace probabilisable produit (97; 427) de la 
probabilité produit (voir exercice 1.1) notée P®7. 

On appelle alors X la v.a.r. qui prend pour valeur le nombre de succès 
obtenus au cours des n réalisations de l’expérience : 


X : (wi; …; un) + Card({w;/w,; € S}) 


Déterminons la loi de X. On a évidemment X(Q) = [0; nn]. 
On calcule ensuite les poids de probabilité, en utilisant la définition de la 
probabilité produit : 


PEr(X =0) = P2(5;..:5) 
— P(S) x … x P(S) 
= (-pr) 

PERX =) = PES: Se 5 S)0.. US.) 
PO De PS 00 
= P(S)P(S)..P(S) ++ P(S)..P(S)P(S) 
= np(i-p} 


Pour k € [0;n] : l'événement (X = k) est la réunion n-uplets où S ap- 
paraît k fois et S apparaît n — k fois. 

Ces événements sont 2 à 2 disjoints, donc par additivité de P®”, la proba- 
bilité de (X = k) est la somme des probabilités de ces événements. 

Ils ont tous pour probabilité p°(1 — p}""#. 


On a : ) n-uplets comportant k fois S et n — k fois S, d’où : 


PP(X = k) = ( | )#a _ pps 


Propriété 4.3 E(X) = np et V(X) = np(1 — p). 


Démonstration : on donne ici une preuve purement calculatoire. Ces deux 
résultats peuvent s’obtenir plus élégamment avec les fonctions génératrices 
(voir fin du chapitre) ou en écrivant À comme une somme de n variables de 
Bernoulli indépendantes (voir chapitre suivant, « vecteurs aléatoires dis- 
crets >). 
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k=0 
— a n—1 F(1— p}* 
k—1 JP? 
k=1 
_ n — 1 _ n—1—(k— 
= m> (is (pe ED 
k=1 


= np 
Même type de calcul pour la variance, en écrivant k? = k(k — 1) + k. 


Exemple 4.1 Soit une urne contenant 6 boules noires et 5 boules rouges 
indiscernables au toucher. On procède à 10 extractions successives d’une 
boule, avec remise. Quelle est la loi du nombre de boules rouges obtenues ? 
On répète 10 fois la même expérience (puisque les tirages se font avec 
remise) modélisée par ( = {N;;...N6; Ra; Rs}, À = P(Q) et P la pro- 
babilité uniforme. Le « succès > est ici : « obtenir une boule rouge > soit 
5 
S = {R1,.….; Ré}, et donc P(S) = —. Par conséquent, en notant X la 
v.a.r. prenant pour valeur le nombre de boules rouges obtenues, on a : 


X + B(10; —). 


IV.4 - Loi hypergéométrique 


Définition 4.4 Soit (N;n) € N° tel que n < N et soit p €]0; 1[ tel que 
Np EN. 
X suit la loi hypergéométrique de paramètres (N;n; p) si : 
1. X(Q) = [max(0;n — N(1 — p)); min(n; Np)] 
(7) N(1—p) ) 
k — k 
2. Vk € X(Q), P(X = k) — SR ——< 
() 


Contexte usuel : on considère une urne contenant N boules (indiscer- 
nables) : des boules rouges en proportion p (donc Np € N) et des boules 
noires en proportion 1 — p. 

On tire simultanément n boules (donc n < N), et on appelle X la v.a.r. 
égale au nombre de boules rouges obtenues. 


On note alors : X = H(N;n;p). 
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On note Ü l’ensemble des boules de l’urne. 
L'expérience est modélisée par { — {A € P(U)/Card(À) = n}, À = P(Q) 
et P la probabilité uniforme. 


Valeur minimale de X : s’il y a au moins n boules noires, c’est-à-dire 
si N(1—p) > n, À peut prendre la valeur 0. 

Si le nombre de boules noires est strictement inférieur à n (ie. N(1 — 
p) < n), le nombre de boules rouges minimum que l’on puisse obtenir est 
n — N(1-—p) (on a obtenu toutes les boules noires possibles). 

La valeur minimale de X est donc bien : max(0;,n — N(1—p)). 


Valeur maximale de X : si le nombre de boules rouges est supérieur ou 
égal à n (Np > n), on peut obtenir au maximum n boules rouges. 

Dans le cas contraire (Np < n), on ne peut obtenir que Np boules rouges 
au maximum. 

La valeur maximale de X est donc bien : min(n; Np). 


Remarque : l’ensemble [max(0; n—N(1—p));min(n; Np)] est exactement 


Np N(1—p) 


l’ensemble des valeurs de 4 pour lesquelles L et n— sont 


strictement positifs. 


Pour k € X(Q), on a : 


Card(X = k) 


li de Card(Q) 


(puisque P est uniforme) 


Or Card(Q) = ps ) (nombre de parties à n éléments d’un ensemble de 


k n — 
contenant 4 boules rouges prises parmi Np boules rouges multiplié par le 
nombre de parties contenant n — k& boules noires prises parmi N(1 — p) 
boules noires). | 


cardinal N) et Card(X = k) — Li ) ( DA 5 ) (nombre de parties 


Remarque : l'égalité >. P(X = k) = 1 peut se vérifier à l’aide de la 
keX(N) 
formule de Vandermonde. 


N—n 
np(1 — p). 


Propriété 4.4 E(X) = np et V(X) — Ni 


wwWw.Ebook777.com 


82 Lois discrètes usuelles 
IV.5 - Loi géométrique 


Définition 4.5 Soit p €]0;1]. X suit la loi géométrique de paramètre p 
s? : 

1. X(Q) = N° 

2. VkE N',P(X =k)=p(1-p)" 

On note alors : X + G(p). 

Remarque : on a bien la convergence de la série de terme général (1—p)""! 
(série géométrique de raison | 1—p|< 1), et 


+00 


S_ pp} = 1 


k=1 


Contexte usuel : on considère une expérience aléatoire modélisée par un 
espace probabilisé ((; 4; P) et on s'intéresse à un événement S, de proba- 
bilité P(S) = p. 

On répète une infinité de fois cette expérience. L’univers est donc NN, c’est- 
à-dire l’ensemble des suites d'éléments de (7. Il faudrait ensuite définir une 
tribu et une probabilité (notons la P), ce qui sort du cadre de ce livre. On 
appelle alors X la v.a.r. égale au rang d’apparition du premier succès (loi 
du « temps d’attente du premier succès >). 

On a donc bien X(Q) = N* et : 


Led — 


VkEeN', P(X=k) = P(S;.:5;5S;Q;..) 


k—1 fois 
P(S) x … x P(S) x P(S) x 1... 
= (1-p)"? 


1 1 
Propriété 4.5 E(X) — = et V(X) — > ( — p) 


Démonstration : on donne ici une démonstration directe (bon entraîne- 
ment sur les séries géométriques dérivées). On retrouvera ces résultats sans 
calculs fastidieux avec les fonctions génératrices. 

Rappel sur les séries géométriques : la série entière Ÿ x* a pour rayon de 


k 
convergence 1, et on a : 


1 
1-7 


+00 
Vx €] — 1,1[, 9 x° = 


k=0 
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Or la somme d’une série entière de rayon R est de classe C® sur | —- R; R|, 


et on peut dériver terme à terme (revoir au besoin ce résultat fondamental 
d'analyse), ce qui donne ici, pour tout x €] —1;1|: 


k-1 _ 2 
DE Az) et DH 1) Aa 


On a donc : 
Le 1 1 
= 2 Hp — ») AG -p}  p 


Même type de calcul pour E(X*), en écrivant k? = k(k — 1) + k et en 
utilisant la somme d’une série géométrique dérivée deux fois. 


IV.6 - Loi de Poisson 


Définition 4.6 Soit À > 0. À suit la loi de Poisson de paramètre À si : 
1. X(Q)=N 
XF 
2. VkEeN, P(X = k) = er 
On note alors : X © P(À). 


+00 
Remarque : on a facilement Ÿ P(X = k) = 1 (série exponentielle). 

k=0 
Contexte usuel : c’est la <« loi limite > d’une loi binomiale lorsque np reste 
constant et n tend vers +00. 


La: a À 
Soit À = np. On considère une v.a.r. À qui suit une loi binomiale B (n; =) : 
n 


()Q DT 


k 
À . nel) Et 1) (n-+) In(1- à) 


Vk € [0;n], P(X = k) 


k! n* 
k 
À 2 
— —E€ 
n—+00 k! 


La loi de Poisson apparaît donc lorsque l’on compte le nombre de succès au 
cours d’un nombre d'épreuves très élevé, avec une probabilité p du succès 
très faible : c’est la loi des « événements rares >. 


P(X =n) 


On peut aussi remarquer que Xl) 


— =. La suite (P(X = n)) 
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des poids de probabilité est donc croissante tant que n < À, puis elle est 
décroissante. Les poids « élevés > sont ceux pour lesquels n est proche de À, 
et ils sont ensuite rapidement très faibles, ce qui justifie aussi l’appellation 
<« loi des événements rares >. 


Propriété 4.6 E(X) = À et V(X) = À. 


Démonstration : on a bien la convergence des séries qui suivent (par 
exemple par la règle de D’Alembert) et : 


Lu: Eu EX _ DAY À 
FRE ne 2 n° Xe? = } 
Pour la variance : 
2 — 2 SR 
E(X?) = ÿ be . 
k=0 
+00 Ë 
= D (k(k—1)+k}e” Fa 
k=0 
+00 +00 
XF À° 
_ — À — À 
= Ÿ k(k-1)e + à ke . 
k=0 k=0 
S k 
—) 
— EX 
a 2) 
= ee + 
= + 


puis V(X) = E(X?) — (E(X)}. 

IV.7 - Fonction génératrice 

Cette partie ne figure qu’au programme officiel de l’Agrégation Interne et 
pas à celui du CAPES. 

Cependant, elle peut intéresser quand même les candidats au CAPES : on 
manipule des séries entières et on retrouve assez facilement les espérances 
et variances usuelles. 


Définition 4.7 Soit X une v.a.r. telle que X(Q) C N. 
On note, pour k € X(Q), px = P(X = k) et on pose, pour k & X(Q), 
Dk — 0. 
On appelle fonction génératrice de X l’application : 
+00 
G:tr Ÿ pat” 


k=0 
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Propriété 4.7 G est définie au moins sur [—1;1|, et elle est de classe C®© 
au moins sur | — 1;1|. 


Démonstration : comme la série Ÿ mm converge (vers 1), la fonction G 
k>0 

est la somme d’une série entière qui converge pour t{ = 1, et qui a donc un 

rayon de convergence R > 1. 


Propriété 4.8 G est continue au moins sur [—1;1]. 


Démonstration : 
él <1= [pat] < px 


Comme la série Ÿ mx converge, la série D» pkt* converge normalement 
k>0 k>0 

sur [—1;1], et donc sa somme G est continue au moins sur [—1;1] (la 

convergence normale de la série entraîne la convergence uniforme de la 

suite des sommes partielles). 

La fonction génératrice d’une v.a.r. À permet d'obtenir ses moments : 


Théorème 4.1 X admet une espérance si et seulement si G' a une limite 
à gauche en 1, et dans ce cas : 


E(X) = lim G(t) 


t—1— 


X admet un moment d’ordre 2 (ou une variance) si et seulement si G® à 
une limite à gauche en 1, et dans ce cas : 


E(X?) — Jim GO(t) + E(X) 


Démonstration : si la série entière qui définit G a un rayon de convergence 
R > 1, alors G est de classe C® sur | — R; R|, donc en particulier en t = 1, 
où l’on a : 


G'() = Ÿ_ ka = E(X) 
k=1 


et : 
+00 


G(1) = SH — Ipr = E(X(X — 1) 


k=2 


d’où le résultat souhaité. 
Le cas qui pose problème est le cas R = 1. On rappelle le résultat suivant 
sur les séries entières : 
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Théorème 4.2 Soit D» anx” une série entière de rayon R > 0, telle que : 
Vn € NN, an > 0. On note S sa somme. Alors : 

S' possède une limite à gauche en R si et seulement s1 ÿ GnR" converge, 
et dans ce cas : 


+00 
Em S(x) = S_ An À 


n=0 


Démonstration : si ÿ a, R" converge, alors D» aAT” converge normale- 
ment sur [—-R; R]. S est donc continue sur [—R; R|, donc elle possède une 
limite à gauche en À qui vaut S(R). 

Réciproquement, si S possède une limite à gauche en À : 

Comme les a, sont positifs, on a : 


N +00 
Vx € (0; R|, Ÿ_ an" < Ÿ_ at" — S(x) 


n=0 n=0 


et comme S est croissante (puisque les a, sont positifs), on a la majoration 
S(x) < lim S(t), d’où : 
t—R- 


N 
. n < : 
Vz € [0; RI, 2_ Ant" < im S(x) 


En faisant tendre x vers À dans l'inégalité précédente, il vient : 


N 
ar" < lim S(x) 
1=0 z—R 


La série ÿ an R” est à termes positifs et a ses sommes partielles majorées. 
Elle est donc convergente et : 


+00 
S ak" < lim S(x) 


n=0 z—hR 


N N 
De plus, Vx € [0; R|, ÿ nl" < > an R”, ce qui permet d’obtenir, en fai- 


n=0 n=0 
+00 


sant tendre N vers +oo : Vx € [0; RI, S(x) < Ÿ ak", et donc : 


n=0 


+00 
li < LR" 
im S(z) < 2° R 


Fonction génératrice 87 


On applique ce résultat sur les séries entières à la série D» kprt*! avec 
R = 1. On a S(t) = G'(t) et donc : 
G’ a une limite à gauche en 1 si et seulement si D» kpx converge (c’est-à- 
dire E(X) existe), et dans ce cas : 


t—1— 


lim G'(t) = 9 kpr (= E(X)) 


On a de la même façon le résultat pour le moment d’ordre 2 avec la série 


D k(k— 1). 


Les exemples qui suivent sont les calculs de fonctions génératrices que 
l’on obtient pour les lois usuelles, ce qui permet de retrouver aisément 
espérance et variance : 


Exemple 4.2 Soit X = B(p). On a immédiatement : 
VER,G(t)=1-p+pt 
D'où les moments : E(X) = G'(1) = p et E(X?) = G@)(1) + E(X) = p. 


Exemple 4.3 Soit X = Bn;p). 
On a Vk € [0; n], px = L )#*0 — pp} et Vk > n,px = 0. La fonction 
G est donc définie sur R par : 


co = D(7 )a pe 
k=—0 
(1—p+pt)" (formule du binôme) 


On a évidemment G(1) = 1. Comme G'(t) = np(1 — p+pt)""!, on obtient 
G'(1) = np, et on retrouve la valeur de l'espérance calculée précédemment. 
En dérivant deux fois, on va pouvoir obtenir la variance : 


G®(t) = n(n — 1p°(1-p+nt) 
donc G)(1) = n(n — 1)p°, d’où la valeur de E(X?) : 
E(X?) = n{n — 1)p° + np 
On obtient enfin V(X) : 


V(X) = E(X°) - (E(X)) 
n(n — 1)p? + np — (np) 
= mpÜl—p) 
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Exemple 4.4 Soit X + G(»p) 
La série Ÿ_p(1 — p}FT 4 converge si et seulement si |(1 — p}t| < 1, et : 
k>1 
1 1 = 
me] ce = Pope 
15 0 2 p) 


pti ((—p})— 


_ pi 
 1-(1—p}t 
1 
Le rayon R = 


étant strictement supérieur à 1, on en déduit l’exis- 
tence de moment de tout ordre, et en particulier 


/ 1 
Ai=G = op © c'@) = = E(X) 
et : 


= 
2(1—p) 1 2(1 — p) 1 _1-p 
donc E(X?) = ==" + =, et V(X) = + 
A) p° A) p? p p?  p 
Exemple 4.5 at X © P(À). 


La série ) e_ 


Vs a un rayon de convergence infini, d’où l'existence 
k>0 


+00 
de moment de tout ordre, et Vt ER, G(t 


QU 
)= 2 AU) — LAlt-1) 


. On en 
déduit l'espérance : G'(t) = 


= Jeé-D » G'(1 = 


= ax ), et la variance : 
GO) (+) = Ve) > GA (1) = x 
= E(X=X +) 
> V(X)=) 
Théorème 4.3 La fonction G caractérise la loi suivie par X 
Démonstration : 


comme une série entière est la somme de sa série de 
Taylor, on a : 


(k) 
Vk EN, px — 0 


LS 
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La donnée de G permet donc d’obtenir (p4)£en et on connaît ainsi la loi 
de À. 


IV.8 - Enoncé des exercices 


Exercice 4.1 La variable X suit la loi de Poisson de paramètre À. On 


pose : Ÿ = . Calculer l’espérance de Y. 


(X +1)(X +2) 


Exercice 4.2 Un compteur devrait afficher les valeurs d’une variable aléa- 
toire X suivant une loi B(n;p). Mais lorsque X est nulle, il affiche un 
nombre au hasard entre 1 et nn. Lorsque X est non nulle, il affiche bien X. 
Soit Ÿ la variable aléatoire prenant pour valeur le nombre affiché par le 
compteur. 

Déterminer la loi de Y, ainsi que son espérance et sa variance. 


Exercice 4.3 X est une variable aléatoire qui suit une loi de Poisson de 
paramètre À. 


1. On désigne par Ÿ la variable aléatoire prenant pour valeur : 


0 lorsque X =2p+1(pEe N) 
p lorsque X =2p (pE N) 


Calculer la probabilité de l'événement < X prend une valeur paire >. 
Déterminer la loi de Y ainsi que son espérance. 


X 
2. On note Z la variable : Z = 4. — 2X +1 ([] désigne la partie en- 


tière). 
Déterminer la loi de Z, ainsi que son espérance et sa variance. 


Exercice 4.4 Soit X telle que X(Q) = N et : 
2 
Vn E N°, P(X =n) = = P(X = n— 1) 
Déterminer la loi de X. 


Exercice 4.5 Loi de Pascal. 

Une urne contient N boules indiscernables au toucher : des blanches en 
proportion p (donc Np boules blanches) et des noires en proportion q = 
1—p. On extrait avec remise n boules. À chaque tirage, on appelle succès 
l’obtention d’une boule blanche et on s'intéresse au temps d’attente du 
rème succès, c'est-à-dire au rang du tirage pour lequel apparaît la lo 
boule blanche. 
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1. Soit k E N°. On appelle À l'événement : < on a obtenu r — 1 succès au 
cours de k — 1 tirages >. 
Déterminer P(A). 

2. En déduire la loi de X,, v.a.r. égale au rang du tirage où apparaît le 
r'ême succès. 
On dit que X, suit la loi de Pascal. 


3. À l’aide des dérivées de la fonction : 


]—1;1 — R 
+00 

ZT + 2 
k=0 


vérifier que D» P(X, = k) = 1, et calculer, si elle existe, l’espérance 
kEX() 
de À... 


Exercice 4.6 Allumettes de Banach. 

Un fumeur a dans sa poche gauche et dans sa poche droite une boîte conte- 
nant N allumettes. Pour allumer sa cigarette, il choisit à chaque fois au 
hasard de se servir dans l’une de ses poches. 


1.-On considère le moment où, pour la première fois, il s'aperçoit que l’une 
des boîtes est vide. Soit X le nombre d’allumettes restant dans l’autre. 
Déterminer la loi de X. 


2. On s'intéresse à l’instant où la première boîte est vide, mais non encore 
reconnue vide par le fumeur. Soit Y le nombre d’allumettes restant dans 
l’autre. Déterminer la loi de Y et en déduire que : 


Cu Fr En 
N —1 


k=1 


Exercice 4.7 Une personne souhaitant rentrer chez elle a un trousseau 
de n clefs. Déterminer le nombre moyen d’essais nécessaires dans chacun 
des deux cas suivants : 


1. La personne élimine après chaque essai la clef qui n’a pas convenu. 


2. La personne remet dans le trousseau après chaque essai la clef qui n’a 
pas convenu. 


Correction des exercices 91 


IV.9 - Correction des exercices 


Exercice 4.1 
D’après le théorème de transfert, l'espérance de Ÿ existe si la série 


1 
TEE UE SRE 


k>0 


k 
converge. C’est le cas puisque P(X = k) — PT et on à : 
+00 —X +00 = 
1 XE e À XF+2 e À 
E(Y) =  — | 
dé 2 HF DE +2 HZ (K+2 f à 


Exercice 4.2 
Comme X(() = [0;n], on a Y(Q) = [1;n]. Soit k € [l;n]. On utilise la 
formule des probabilités totales : 


“ P(Y =k/X =i)P(X =5) 
= P(Y = k/X =0)P(X =0)+ P(Y =k/X =k)P(X = k) 


(1 n'E: : )P*a =} 


P(Y =k) 


L'existence de l'espérance et de la variance de Y est claire puisque Y (Q) 
est fini. 


E(Y) Dev =-p=-rQ-p> es DE ( TE )pa ps 


On reconnaît dans le deuxième terme l’espérance de X, d’où : 


E(Y) = (1= py° x LT + np 


Le calcul de E(Y*) se fait de la même manière (on reconnaît dans le 


deuxième terme E(X°)), et on obtient : 


n(n + 1)(2n + 1) 


E(Y?) = (1- pp LEE 


+ np(1l — p) +n°p° 


puis on en déduit V(Y). 


wwWw.Ebook777.com 


92 


Exercice 4.3 
1. Comme X = P()) : 


Lois discrètes usuelles 


P(<« X prend une valeur paire >) — 


| 
® 

> 
Q 
© 
Un 
mx 
> 


OnaY(Q)=N,et : Vk> 0, P(Y =k)=P(X =2k)=e 
Pour k = 0 : 


P(Y =0) P( « X prend une valeur impaire >) + P(X = 0) 


= 1—e7*(cosh À) + e* 


L’espérance et la variance existent (vérifier la convergence des séries), 
et : 


E(Y) 


hé 
PS* 
& 
= 
E 


+00 
di D_,ke” | 
o (2) 
de} +00 X2k-1 
2 = (2k — 1)! 
— À 
= : sinh À 


puis en faisant apparaître des séries usuelles : 
V(Y) = Xe (sinh(21) +2) 
. Si À prend une valeur paire, alors Z = 1 et si X prend une valeur 
impaire, alors Z — a — —2X +1=—1, d'où Z(Q)={—-1;1}. 
P(Z = 1) = P(« X prend une valeur paire >) = e* cosh À 


et P(Z = —-1) = 1 - e* cosh À. L’espérance et la variance sont évidem- 
ment bien définies, et : 


E(Z) = e”* cosh À — (1 — e-* cosh À) = e*(2 cosh(À) — e*) = e-?? 
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Z? est constante égale à 1, donc E(Z?) = 1 et on en déduit la variance 
V(Z)=1-e 


Exercice 4.4 
Par une récurrence immédiate, on à : Vn > 1, P(X = n) = —P(X = 0). 
On calcule P(X = 0) : 


D PO =n) = P(X = 0) D) = «x = 0e 


On a donc P(X = 0) = e”?. 
Conclusion : Vn EN, P(X = n) — 2” 


“ e ?, et on reconnaît une loi de Pois- 
son : À w P(2). | 


Exercice 4.5 


1. On reconnaît le contexte usuel de la loi binomiale. La probabilité d’avoir 
r — 1 succès au cours de k — 1 répétitions est donc : 


P(A) = ( FU. Eee 


Tr — 1 


2. On a bien sûr X,(Q) = [r;+oo[. Soit k > r. On note S4 l’événement 
< on à obtenu un succès au Æ*T% essai > : 


P(X, = &) = P(Sx N 4) = P(Sk)P(A) = k—1 ) Da 


3. On vérifie que la somme vaut 1 : 


= k—1 r kr p° = (x — 1)! —T 
D (ri )ra _ (r —1)! 2 Gt 


=T 


dérivée d'ordre (r—1) de 5° q#* 
T 
r—1)! 
p'_,(r-1 


r—1)! (1—a) 
= ] 


L’espérance se calcule de manière analogue, et on obtient : 


EU = p" r! Tr 
( =) * (—g)4H p 
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Exercice 4.6 

On est dans le cas de la répétition de la même expérience aléatoire : 
mettre la main dans la poche gauche ou dans la poche droite. On pose 
A ={D;G}", A = P(Q), et on prend comme probabilité la probabi- 
lité produit (pour rendre compte que les répétitions se font de manière 
« indépendantes >). 


1. On a évidemment X(Q) = [0; N]. Soit k € [0; N]. S'il a vidé la poche 
droite : 


P((D ou G;---; D ou G; D; D ou G;---; D ou G)) 
te, ns” 
N fois D et N—-k fois G 


ADHIORE 


On a bien sûr le même résultat s’il a vidé la poche gauche, d’où : 


ren (QT 


2. On a Y(Q) = [0; N]. Soit ke [0; N]. 
Si c’est la poche droite : 


P((D ou G;:--:; D ou G; D; D ou G;:-:; D ou G)) 
a ———— 
N-1 fois D et N—-k fois G 


_{f2N—-k-1 É 2N—k-1 
Ù n-i 1 “2 
Même résultat si c’est la poche gauche, d’où : 


en (PAT) 


N 


Pour le calcul de la somme : on a nécessairement D» PY=SE)=T 
k=0 
soit : 
N 
(7% Lo _ 92N 
k=0 
Exercice 4.7 
On note B la bonne clef et M,--:,M,_1 les mauvaises clefs. 
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1. (2 est l’ensemble des permutations des éléments B, M,:::,M,_:1. On 
prend pour tribu 4 = P(Q) et pour probabilité P la probabilité uni- 
forme (on suppose le choix des clefs fait au hasard). Soit X la variable 
aléatoire qui à une permutation associe le rang d’apparition de B dans 
cette permutation. 

On a évidemment X(() = [1;n]. On calcule les poids de probabilité : 


Card(X =k) (n—-1)! 


1 


1 
Par conséquent, X + Uni: et donc E(X) = — 


2. On pose comme univers ( = {B; M:;°::; My_1}". Soit X la variable 
égale au rang d’apparition du premier succès : on reconnaît une loi 


géométrique, de paramètre — (on suppose qu’à chaque répétition de 


l'expérience, les n tirages possibles sont équiprobables), et par consé- 
quent E(X) = n. 


Chapitre V : Vecteurs aléatoires discrets 


V.1 - Loi de probabilité 


Définition 5.1 Soit ((;.4; P) un espace probabilisé. 


À 
Un vecteur aléatoire V est un n-uplet : où les X; sont des variables 
Xn 
aléatoires réelles {sur ({; 4; P)), c'est-à-dire une application : 
(Q — R” 
X1(w 
V : 1( ) 
WU + . 
Xn(w) 


V est appelé vecteur aléatoire discret si les X; sont des variables aléatoires 
discrètes. 


On considère dans la suite le cas n = 2. 


Exemple 5.1 On lance deux fois un dé équilibré. On modélise cette expé- 
rience en posant ® = [1,6], A = P(Q) et P la probabilité uniforme. 
Soient X la v.a.r. égale à la somme des 2 lancers et Y la v.a.r. égale au 
maximum des 2 lancers. L'application 


(@ — R° 


w = (wi;we) + C2 mano) ) 


V : 


est un vecteur aléatoire discret. 


Propriété 5.1 On a directement d’après la définition : 
V(N) € X(Q) x Y(Q) 


et comme le montre l’exemple précédent, cette inclusion peut être stricte 
((3;:6) & V(Q) et (3:6) € X(Q) x Y(Q)). 
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On note dans toute la suite X(Q) = {x;;1 € T} et Y(Q) = {y,;5 € J} où 
I et J sont des parties de N. 


La loi de probabilité de V est par définition l’application : 


| Br — [0; 1] 
DE = P(VEB) 


où Br2 est la tribu des boréliens de R° (engendrée par exemple par les 
pavés [a1; b1] X [as; b2]). Or cette application y est entièrement déterminée 
par la donnée de V({) et, pour tout couple (x;;y;) € V(Q), la donnée de 
P((X;Y) = (x;y;)). L’additivité de P permet alors de calculer P(V € 
B) pour tout pavé, et donc pour tout borélien de R°. On prend donc la 
définition suivante : 


Définition 5.2 La loi de V, ou loi conjointe du couple (X;Y), est la 
donnée de : 


1. V(Q), ensemble des valeurs possibles de V. 
2. P((X;Y) = (x; y;)) pour tous les couples (x;;y;) de V(Q) 


On note pi; = P((X;Y) = (mi; g5)). 

En pratique, on donne tous les p;; en posant bien sûr p;; — 0 lorsque 
(z:; Y;) n'appartient pas à V(Q). 

Ceci permet de donner la loi, lorsque Z et J sont finis (et de cardinal 
raisonnable !), sous la forme d’un tableau à double entrée. 


Exemple 5.2 On reprend le premier exemple, où on lance deux fois un 
dé équilibré. On a la loi conjointe suivante : 


Lois marginales 


ETES 
00 
Ge 
2 |2 
2 | 2 
2 © 
1 | 2 

2 
DE 

1 
DE 


Exemple de calcul : 


P(X=3NY =2) 


P({1;2}U {2;1}) 


PU 25) + P({21}) 


36 
V.2 - Lois marginales 
Définition 5.3 Ce sont les lois des variables X et Y. 
Elles se déduisent de la loi conjointe : 


(X=x) = BIC: = 4) N (Y = y;)) (union disjointe) 


jeJ 


= P(X = t;) LS P((X =) NY = y;)) 


jEJ 
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Soit, en notant p;. = P(X = Pi. 
jeJ 
(même raisonnement pour la loi de Ÿ). 


Exemple 5.3 Dans l'exemple précédent, on obtient la loi suivante pour 


VE 
YQ1112/31415]6 
151570 iu 
P.3 | 36 | 36 | 36 | 36 | 36 | 36 
V.3 - Lois conditionnelles 
On fixe un événement (X = x;) (rappel : c’est un abus de notation utilisé 
fréquemment, il s’agit de X-!({x;}), qui est bien un élément de la tribu À, 
puisque X est une variable aléatoire, et c’est donc bien un événement.….), 
ou plus généralement un événement (X € Î) où 1 est un intervalle de R, 
de probabilité non nulle. 
On veut déterminer la loi de Ÿ sachant que (X = x;) est réalisé. 
Par définition, c’est l’application : 
Br — (0:;1] 


Comme Y (Q) = {y;; j € J}, cette application est déterminée par la donnée 
de Pix=3](Y = y;),j € J, d'où la définition : 


Définition 5.4 La loi conditionnelle de Y sachant (X = x;) est la donnée 


de : 
(2 re me . 


c’est-a-dire, avec les notations usuelles pour les couples de variables discré- 


tes, la donnée de : 
Pi,j 
CR 
Pi,. / jEJ 


On a la même définition pour la loi conditionnelle de X sachant (Y = y;). 


Exemple 5.4 Avec l'exemple précédent, la loi conditionnelle de X sa- 
chant (Y = 3) est : 
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V.4 - Indépendance de 2 variables aléatoires réelles 


On rappelle la définition vue au chapitre IT. 
Définition 5.5 Deux v.a.r. À et Ÿ sont indépendantes si : 


V(B1; Bo) € (Br)°, P(X € BiNY € B:) = P(X € B;)P(Y € B>) 


Propriété 5.2 Lorsque X et Y sont discrètes, la définition est équivalente 
à : 
V(i,j)€E LI x JP(X =mNY = y) = P(X = %x;)P(Y = y;) 


Avec les notations usuelles pour les couples de v.a.r. discrètes, il faut et il 
suffit donc de vérifier que : 


V(i,1)ET x Jpi; = pi.p.; 


Exemple 5.5 Les variables X et Y de l’exemple précédent ne sont pas 
indépendantes puisque P(X =2NY = 2) £ P(X =2)P(Y = 2). 


V.5 - Espérance du produit de 2 variables aléatoires 


Théorème 5.1 Soient X et Y deux v.a.r. discrètes indépendantes, ad- 
mettant une espérance. Alors la v.a.r. XY admet une espérance, et : 


E(XY) = E(X)E(Y) 


Démonstration : on vérifie tout d’abord la sommabilité de la famille 
(TiYiDij er, jes. Soient L' C I, l' fini, et J' C J, J'fini. 


> TiY5Di,5| Ÿ Ti|D4, 3 Y51D.,5 


iel',jeJ' iel' jEJ! 
< ON ri D lp. 
ici jEeJ 


donc pour toutes parties finies l’ et J', la somme est majorée par une 
constante, d’où la sommabilité de la famille. On peut alors effectuer le 


calcul : 
D» TiVjPi, 
3 
Ÿ Tiji, D. 
3 


ii 


0» ps.) 0 712) | 


E(X)E(Y) 


E(XY) 
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Remarque : on a P(XY = xiy;) > P(X = mi NY = y,) et l’inégalité 
peut être stricte. Sur l’exemple traité tout au long de ce chapitre, on a 
P(XY =2x6)=P(X=2NY =6)+P(X =3NY = 4). Mais comme 
on somme sur tous les couples de JZ x J, on calcule bien E(XY). 


Attention : la réciproque de ce théorème 5.1 est fausse : l'égalité E(XY) — 
E(X)E(Y) n'implique pas l'indépendance de X et Y (voir exercice 5.6). 


V.6 - Indépendance de ñn variables aléatoires 
On rappelle la définition vue au chapitre IT : 


Définition 5.6 Soient X1, X2,.., Xn n v.a.r. (définies sur le même es- 
pace). Elles sont indépendantes si pour tout ensemble d'indices T inclus 
dans [1;n], on a, pour toute famille de boréliens (B;)ier : 


ici il 


Propriété 5.3 Lorsque les n v.a.r. sont discrètes, il est équivalent de 
vérifier que c’est vrai sur leur support, c'est-à-dire : pour tout ensemble 
d'indices I inclus dans [1;n], on a, pour toute famille (B;);er de (X;(9) lier 


P fn = 2) = ][P(X € B;) 


Propriété 5.4 L'indépendance de n v.a.r. entraîne leur indépendance 2 à 
2, et la réciproque est fausse. 


Démonstration : on suppose que À1,...,%X, sont indépendantes. En ap- 
pliquant la définition avec B3 = B4 = … = B, = KR, on a : 


V(B:; Bo) E (Br), P(X: € B1NXo € Po N ÀX3 EeRN..nNX,E R) 
— P(x1 € B:1)P(X2 € B)P(X3 ER)..P(X, € R) 


soit : P(X1 € B1NX2 € Bo) = P(X1 € B:)P(X2 € B>), et X1 et X2 sont 
donc indépendantes. 


Pour le fait que la réciproque est fausse, voir l’exercice 5.5. 


Le programme officiel admet le résultat suivant : 


Propriété 5.5 Si X:,...,X, sont indépendantes, alors toute fonction de 
X1,...,X, est indépendante de toute fonction de X,11,...,Xn. 
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Par exemple, si X et Y sont indépendantes, alors X° et Ÿ sont indépendan- 
tes. 

On peut aussi le voir directement en revenant à la définition de tribu 
engendrée par une variable aléatoire (définition 2.2) : on remarque que 
X et Ÿ sont indépendantes si et seulement si tout événement de Ax est 
indépendant de tout événement de Ay. Or Az: C Ax : en effet, pour tout 


intervalle ]a;b[, (X 2)" (Ja; b|) est égal à l’ensemble vide si a et b sont 
négatifs, à À 1 — Vb: vë) si a est négatif et b positif, et à X7! ( — 
VD: Val) U X (va; vè|) si a et b sont positifs, donc dans tous les 


cas, (X*)-‘{Ja;b[) € Ax. Comme les intervalles ]a; b[ engendrent BR, on 


a Ax2 C Ax, et donc tout événement de Ax2 est indépendant de tout 
événement de À. 


V.7 - Somme de n variables aléatoires 


On considère l’ensemble des v.a.r. discrètes définies sur le même espace 
(Q;.4; P), noté F. 

Muni de la loi + (addition usuelles de 2 fonctions : (X + Y }(w) est égal 
par définition à X(w) + Y'(w)) et de la loi . (loi de composition externe 
classique : VA € R, À.X est la fonction définie par : (A.X)(w) = AX{(w)), 
(F'; +;.) est un espace vectoriel. 

On détaille ici les propriétés des opérateurs E et V, ainsi que celles de la 
covariance. 


Propriété 5.6 Soit F1 l’ensemble des éléments de F' qui possèdent une 
espérance : 


1. F, est un sous-espace vectoriel de F'. 


2. E est une forme linéaire sur F1. 


Ces résultats ont été démontrés au paragraphe 4 du chapitre III (il y avait 
un cas simple, lorsque {2 est fini ou dénombrable, et le cas général a été 
traité en écrivant les variables aléatoires comme combinaison de fonctions 
indicatrices…). 


Propriété 5.7 Soit EF l’ensemble des éléments de F' qui possèdent une 
variance. F) est un sous-espace vectoriel de F' inclus dans F1. 


Démonstration : soient X et Y deux éléments de F2. 

Il faut montrer que À + Ÿ possède une variance, ce qui équivaut à montrer 
que X + Y possède un moment d’ordre 2, autrement dit que (X + Y )* — 
X?+Y?+2XY possède une espérance. Comme X et Ÿ possèdent une 
variance, elles possèdent un moment d'ordre 2 : E(X*) et E(Y*) existent. 
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On montre que cela implique que E(XY) existe (en cas de difficulté, c’est 
l’objet de l'exercice 5.1). On a donc X 2 Y?et XY qui possèdent une 
espérance. Comme F; est un sous-espace vectoriel, X*°+Y?+2XY possède 
une espérance, et donc (X + Y}? possède un moment d'ordre 2. 

On montre enfin que F; € F1 : on prouve que si À possède un moment 
d'ordre 2, alors X possède un moment d’ordre 1 (voir l'exercice 3.5). 


Définition 5.7 L'application : 


C | (F)° — RKR 
ov: À (X;Y) » E(XY)-E(X)E(Y) 


est bien définie, et est appelée covariance de X et Y. 


(On vient de montrer que si X et Y sont deux éléments de F2, alors XY 
possède une espérance). 


Propriété 5.8 V(X1;...; X,) € (F2), 
V(Dx)=V(x)+2 D Cox: X;) 
i=1 i=1 1<i<j<n 


Démonstration : procéder par récurrence sur n, en utilisant la linéarité 
de E,. 


Un cas particulier très important est celui où les variables X1,.,X, sont 
indépendantes deux à deux. On a alors : 


Vi #5, E(XiX;) = E(X)E(X;) 
Autrement dit : Vi £ 7, Cov(X;; X;) = 0. D'où la formule suivante : 


Propriété 5.9 Soient X1,..,X, des variables appartenant à F2 qui sont 
indépendantes deux à deux. Alors : 


(5 x) _ > V(X;) 


Par linéarité de FE, on obtient directement une autre expression de la co- 
variance : 


Propriété 5.10 V(X;Y) € (F)?, 


Cov(X;Y) = E((X - E(X)}(Y - E(Y)) 
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La covariance est donc l’espérance du produit des deux variables préalable- 
ment < centrées >. 
V.8 - Covariance et coefficient de corrélation linéaire 


On donne ici quelques propriétés d’algèbre bilinéaire, qui seront notam- 
ment reprises pour <« éclairer > la leçon sur les séries statistiques à deux 
variables. 


Théorème 5.2 L'application Cov est une forme bilinéaire symétrique po- 
sitive sur l’espace vectoriel F2. 


Démonstration : 

1. Symétrie : on a immédiatement Cov(X; Y) = Cov(Y; X). 

2. Bilinéarité : il suffit d'utiliser la linéarité de E. 

3. Positivité : VX € F, Cov(X; X) = E((X = E(X)}) = V(X) > 0. 


La covariance n’est pas définie-positive puisqu'on à vu que : 
V(X) =0 = X est constante (presque partout) 


On n’a donc pas un produit scalaire sur F2, et o n’est donc pas une norme. 
Si on se restreint au sous-espace vectoriel de F, formé par les variables 
centrées, alors la covariance est un produit scalaire : si V(X) = O, alors X 
est constante, et comme son espérance est nulle, elle est nulle. 


Définition 5.8 Soient X et Y deux éléments de F2, de variance stricte- 
ment positive. On appelle coefficient de corrélation linéaire le réel : 


Cov(X;Y) 
XŸ) = 

PET TM) 

On précisera son interprétation lors du commentaire de la leçon sur les 

séries statistiques doubles. 


Propriété 5.11 
VOX; Y) e (PB), lp(X; Y)| <1 


Démonstration : on doit démontrer que | Cov(X; Y)| < o(X)o(Y). 

Si on avait un produit scalaire, il s’agirait donc de montrer que la va- 
leur absolue du produit scalaire est inférieure ou égale au produit des 
normes, ce qui est l’inégalité de Cauchy-Schwarz, que vous devez savoir 
impérativement démontrer | 
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On va utiliser la même démonstration ici (elle ne nécessite pas la définie- 
positivité) : soit À € R. 


V(X + AY) = V(X) + XV(Y) +2X Cov(X;Y) 


Ce trinôme en À est toujours positif ou nul (V(X +AY) > 0), donc son dis- 
criminant est négatif ou nul, et comme À = 4(Cov(X;Y)}? —4V(X)V(Y), 
on en déduit que (Cov(X;Y})? < V(X)V(Y). 


Remarque : si on centre À et Ÿ, c’est-à-dire si on considère X* — 
X — E(X) et Y* = Y — E(Y), le coefficient de corrélation est inchangé : 
PX;Y) = p(XT Y*) 
En effet V(X*) = V(X — E(X)) = V(X) et : 
Cov(X*:Y*) = E((x" = E(X*))(* E(Y*))) 
— E(X*Y*) 
E((X-E(X)\(Y -E(Y))) 
— Cov(X;Y) 


V.9 - Somme de variables de Bernoulli indépendantes 
On considère une expérience modélisée par un espace probabilisé ({; 4; P). 
On s'intéresse à un événement que l’on appellera « succès > noté S, et on 
note p sa probabilité. On répète n fois cette expérience, et on se place sur 
(NT; A®°) que l’on munit de la probabilité produit P®* (ce qui permet de 
traduire que les répétitions de l'épreuve sont « indépendantes >). 

On définit, pour à € [l; nl] : 

x. (7 — {0;1} 
"| (u1;.…;un) + 1siw, ES, 0 sinon 


X; est donc l’indicatrice du succès lors de la i“"* épreuve. On a X;(°) = 
{0; 1} et : 

PE(X; = 1) 

PR" (un; su 1; wi; ui; un) € (0... 0; 550; ..: Q)) 

Pur € Q)..P(w;_1 € N)P(u, € S)P(uw;,1 € Q)...P(u, € A) 
1.1xpxl...l=9?p 


Par conséquent : X; + B(p). 
Les variables X1,...,X, sont indépendantes, et on a : V(a1;…;a,) € {0;1}", 


Pe((X;; 3 Xn) — (@1; 3; An)) PEUX; — du)... PEUX, — an) 
= pp) 
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où k est le nombre de a; égaux à 1. 


n 
On définit Z = dx; v.a.r. égale au nombre de succès obtenus lors des 


i=1 
n réalisations. On a : Z(Q") = [0; n], et : 


car il y a L ) n-uplets (a1;…;a\) distincts qui comportent & fois 1 et 
n — k fois 0. 
Conclusion : Z + Bln; p), d’où le théorème : 


Théorème 5.3 Soient X1,...,X, des v.a.r. définies sur le même espace, 
indépendantes et qui suivent toutes une loi de Bernoulli de même paramètre 


D. 


Alors leur somme Z = D» X; suit une loi binomiale B(n; ?p). 
i=1 


On retrouve alors facilement l’espérance et la variance pour la loi B(n; p) : 


— E(5) Xi) _— D Ex) — 


Pour la variance, on développe en utilisant l’indépendance des Y, : 


=v(5x) - D V(X) = mp - » 


2—=1 


V.10 - Somme de variables binomiales indépendantes 
On a la stabilité de la loi binomiale pour la somme au sens suivant : 


Théorème 5.4 Soient X1,...,X, des v.a.r. définies sur le même espace, 
indépendantes et telles que Vi € [1;n],X; + B(n;;p). Alors : 


SX, à B(S_ rip) 
i=1 i=1 


Démonstration : on traite le cas n = 2 (la démonstration se fait par 
récurrence en utilisant la même idée). 
Comme X; © B(n1;p), elle peut s’écrire comme une somme de n1 variables 
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n1 
de Bernoulli indépendantes : X1 = D où Vi € [l;n],Y; + B(p) et les 


i=1 
Y. sont indépendantes. 
ni+n2 
On décompose de la même façon X2 : Ào = >. Yi où Vi € [na + Lu + 
i=Nn1 +1 
n2], Y: — B(») et les Ÿ; sont indépendantes. 
n1+n2 
Alors X1 + X2 = >. Y; où les n1 + n2 variables Y; suivent une loi B(») 
i=1 


et sont indépendantes. On a donc bien : X3 + X2 © B(ni + n2; p). 
V.11 - Somme de variables de Poisson indépendantes 


On a là aussi une stabilité pour la somme : 


Théorème 5.5 Soient X1,...,X, des v.a.r. définies sur le même espace, 
indépendantes et telles que Vi € [1;n],X; + P(x). Alors : 


D x-P(3x) 


Démonstration : on traite le cas n = 2 (faire la démonstration par 
récurrence, les calculs se mènent exactement de la même façon). Soient 
X, une v.a.r. qui suit une loi P(A:) et X2 qui suit une loi P(A), avec X: 
et X2 indépendantes. 

On a d’une part (X1 + X2)(Q) = N, et d'autre part, pour k € N: 


k 
P(Xi+X2=k) = ŸN P(Xi=iNX2=k—i) 
i=0 
k 
= N P(Xi=i)P(X2= ki) 
i=0 
(car X1 et X, sont indépendantes) 


|| 
| 
> 
ai 
s.l > 
| 
| 
> 
N 
FN, 
F|S 
| |(S 
eue EL 
Le 


2—=0 


de Le r 
k! 
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V.12 - Enoncé des exercices 


Exercice 5.1 Soient X et Y deux v.a.r. discrètes admettant une variance. 


1. Montrer qu'alors XY admet une espérance et que : 
1 
E(IXYD) < ;(E(X*) + E(Y°) 


2. Montrer que : |[E(XY)| < YE(X?2)E(Y?) (penser à la démonstration 
de l'inégalité de Cauchy-Schwarz). 


Exercice 5.2 On lance deux fois une pièce de monnaïe équilibrée. Soient 
X la variable prenant pour valeur le nombre de Pile obtenus moins un, et 
Y la variable prenant pour valeur le nombre de Pile au deuxième lancer 
moins le nombre de Pile au premier lancer. 


1. Déterminer la loi conjointe du couple (X;Y). 
2. Calculer la covariance du couple. 


3. Les variables À et ŸY sont-elles indépendantes ? 


1. Déterminer les lois marginales du couple et préciser si À et Y sont 
indépendantes. 


2. Calculer Cov(X;Y). 
3. Déterminer la loi du couple (min(X; Y );max(X; Y)). 


Exercice 5.4 On lance trois fois une pièce de monnaie équilibrée; X et 
Y désignent respectivement le nombre de Face apparues lors des deux pre- 
miers lancers et le nombre de Pile apparus lors des deux derniers. 


1. Déterminer la loi du couple (X;Y) puis les lois marginales de X et Y. 
2. X et Y sont-elles indépendantes ? 
3. Calculer Cov(X;Y). 


Exercice 5.5 Soient X et Y deux variables indépendantes de support 
{—1;1} et distribuées uniformément (poids de 0.5 sur -1 et sur 1). 

On considère Z = XY : les variables X,Y et Z sont-elles indépendantes 
2 à 2? Sont-elles mutuellement indépendantes ? 
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Exercice 5.6 Soit X de support {—a;—-b;b;a} (0 < b < a) distribuée 
uniformément. 


1. Donner la loi de X° et la loi conjointe du couple (X; X°). 
2. Calculer Cov(X; X?). 
3. Les variables X et X°? sont-elles indépendantes ? 


Exercice 5.7 Soient X et Y suivant toutes les deux une loi de Bernoulli 
B(p). Montrer que : 


X et YŸ sont indépendantes = Cov(X; Y) = 0 


Exercice 5.8 Soit X de loi B(n;p) et soit Y une v.a.r. à valeurs dans N 
telle que la loi conditionnelle de Y sachant (X = k) est la loi B(k; q). 


1. Montrer que : 


va eloinlvie tant (1 )()-(5)(%22) 


2. Déterminer la loi de Y. 


Exercice 5.9 Une particule se déplace sur une droite graduée. À l'instant 
zéro, la particule est en zéro. À l'issue de chaque instant, elle s’est déplacée 
d’une unité dans le sens positif avec la probabilité p, ou dans le sens négatif 
avec la probabilité 1 — p. On note X, la variable aléatoire prenant pour 
valeur l’abscisse de la particule à l'issue de l'instant n. 


1. Déterminer P(X, = 0). 
2. Calculer l'espérance et la variance de X}. 


Indication : on pourra décomposer X, comme une somme de v.a.r. qui 
prennent les valeurs +1 et -I. 


Exercice 5.10 Soient À et B deux événements indépendants. 
Les indicatrices 11 et 18 sont-elles indépendantes ? Réciproque ? 


V.13 - Correction des exercices 
Exercice 5.1 


1. On note X(Q) = {ri € I} et Y(Q) = {y,;,5 € J}, où I et J sont 
des parties de N. Pour montrer l'existence de E(XY ), il faut montrer 


la sommabilité de la famille (aivpis). On a l'inégalité : 


1 
PATES (2? +) 
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Soient l’ une partie finie inclus 
dans J : . € dans I et J' une partie finie incluse 


TiY5|Di5 < 
.» nn 2° Diÿ Ts )) 2, VU; Di;j 

< 9 ST! D es = 9 NID 
si jeJ jeJ' ie 

< 2 ain, + . +. VSD. 
1ElI! . 

= Erin, T3 Dur D ;j 
i€I 2e 


£ (Ex ?) + E(Y?)) 


La famille est donc bien sommable, et comme l'inégalité est vraie pour 
toutes les parties finies l’ et J”, on a : 


1 
DE < (EG?) +E (2) 
& E(XY) < ;(E(X°)+E(2) 


2. On développe E((X + AY )?) : 
E((X +1Y)°) = E(X?) + V'E(Y?) +2XE(XY) 


On obtient un polynôme de degré 2 en À (sauf si E(Y?) = 0, auquel cas 
Y est nulle et l’inégalité est évidente), qui est toujours positif ou nul, 
donc son discriminant est négatif ou nul : 


A=(E(XY)} - 4E(X°)E(Y?) < 0 
D'où : 
JE(XY)| < VE(X?)E(Y?) 


Exercice 5.2 
On pose N = {P; FF, À = P(Q) et P la probabilité uniforme. 
1. On a les valeurs de X et Y pour chaque événement élémentaire : 
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Lu, 


D'où la loi du couple (X; Ÿ) : 


2. On obtient par un calcul immédiat : 


3 3 


Cov(X;Y)= SN D mis = 0 


i=1 j=1 


3. Les variables X et Ÿ ne sont pas indépendantes car 


P(X=-1NY =-1)=0 et P(X =—1)P(Y = 1) 


Exercice 5.3 
1. On obtient immédiatement les lois marginales : 


. 
Ci [oafozfos 


X et Y sont indépendantes (il faut effectuer les 12 vérifications). 


2. Par conséquent : 


Cov(X;Y)=0 


3. On obtient facilement : 


Exemple de calcul : 


P(min(X;Y)=1Nmax(X;Y)—3) 
= P((X=I1NY =3)U(X =3NY =1) 
P((X=1NY =3)+P((X=3nNY =1) 
0.16 + 0.08 
— (0.24 
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Exercice 5.4 


On pose A = {P;, F, A = P(Q) et P la probabilité uniforme. 
1. On a les valeurs de X et Ÿ pour chaque événement élémentaire : 


D'où la loi du couple ( 


2. On constate que les variables ne sont pas indépendantes, puisque : 
PIX=20Y-=2)P(K=2)P(Y=2) 


1 
3. Par le calcul, Cov (X; Y) — 2 


Exercice 5.5 
D’après l’énoncé, X et Y ont pour loi : 


[05/05] * [__ [05/05 
1. L'hypothèse d'indépendance de X et Ÿ permet d'obtenir la loi de Z : 
on a bien sûr Z(Q) = {—-1;1}, et : 
P(Z =1) = P((X=INY =1)U(X =-INY = -1) 
= P(X=1INY =1)+P(X =-INY = -1) 
= P(X =1)P(Y =1)+P(X = -1)P(Y = -1) 


Dir 
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1 
On obtient de la même façon P(Z = —1) = 5: 
2. On détermine la loi du couple (X; Z) : 
Exemple de calcul : 
P(X=-1NZ=-1) = P(X=-INXY = -1) 
— P(X =-1)P(Y =1) 
= 1 
_ 4 


L’examen de la loi du couple (X; Z) et des lois de X et de Z permet 
d’en déduire que X et Z sont indépendantes (4 vérifications). Les calculs 
sont identiques pour la loi de (Y;Z), et on conclut également qu’elles 
sont indépendantes. Les variables X, Ÿ et Z sont donc indépendantes 
deux à deux. 

Pour l’indépendance mutuelle, il faudrait en plus que À, Y et Z soient 
indépendantes, ce qui n’est pas le cas puisque : 


P(X=INY =1NnZ=-1) 
et P(X =1)P(Y =1)P(Z = -1) 


œI= © 


Exercice 5.6 
La loi de X est d’après l’énoncé : 


ECRIRE 


1. On en déduit la loi de X?° : 
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Exemple de calcul : 
P(X = anX* = a) 
1 
=P(X=anxX=-a)+P(X=anx=a)=z 


2. On obtient la covariance par le calcul, ou directement : 
Cov (X; X°?) = E(X*) — E(X)E(X?) = 0 


puisque E(X) = 0 et E(X*) = 0 (sans calcul, ces deux variables ayant 
une distribution parfaitement équilibrée autour de 0). 


3. Les variables X et X° ne sont pas indépendantes : 
P(X=anxX*=b)=0et P(X = a)P(X? = b?) 40 


Remarque : on a donc deux variables qui ont une covariance nulle et qui 
ne sont pas indépendantes. La réciproque du théorème 5.1 est donc fausse. 
Dans l’exercice qui suit, on montre que l’équivalence entre indépendance 
et nullité de la covariance est vraie pour des variables de Bernoulli. 


Exercice 5.7 
On a démontré dans le cours que : 


X et Ÿ indépendantes = Cov(X;Y)=0 


Réciproque : on suppose que X = B(p) et Y + B(p), et que ces deux 
variables ont une covariance nulle, c’est-à-dire que E(XY) = E(X)E(Y). 
Dans l’expression de E(XY ), il n’y a qu’un terme non nul : 


EXY)= SYÿP(X =inY = ÿ) = P(X=10Y = 1) 


i=0 j=0 
d'où P(X =1NY =1) = E(X)E(Y) = p°. On en déduit : 
P(X=1NY =0)=P(X=1)-P(X=1INY =1)=p-97 


puis de la même facon les deux derniers poids de probabilité, ce qui donne 
comme loi conjointe : 
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On vérifie bien que les deux variables sont indépendantes (faire les quatre 
produits). 


Exercice 5.8 
1. C’est immédiat par le calcul : 


a )(5) = ares 


nl (n — a)! 
al(n — a)! (i — a)!l(n —i)! 


(a )(=e) 


2. doit à € N. On développe avec la formule des probabilités totales : 


S'P(Y=anX=;i) 


i=0 
Ÿ Px=j(Y = a)P(X = 5) 
i=0 

Or la loi de Y sachant (X = i) est la loi B(1; q), donc : 


P(Y = a) 


0 si a>i 
x = a) = (is )ra-o si O<a<i 
Donc, sia>n, PY =a)=0etsia<n: 


FOT=0) : | g (a) . )r'a sn 
_ k }r> .. | (a) pr)" 


En posant 7 = à — à, il vient : 


si 


n—œ 


d dns. Ds . )rY vu | (gp p (=D 


_ . | mE( + | CS) DR) LE ES 
5-0 


(p-qgp+1-p}r-a 


) (gp) (1 — gp)" * 


Î 
FN 
Q S 
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Conclusion : Y + B{n; qp). 


Exercice 5.9 


1. Pour être en 0 à l’issue de l’instant n, la particule doit avoir fait autant 
de sauts vers la droite que vers la gauche. Donc si n est impair, P(X, — 
0) = 0, et si n = 2k : 


Lo à ( . ) DE) 


DL X = ÿ Y, où les variables Y; sont indépendantes de loi : 


i=1 
»:(Q) 
[1 =plr 
Donc E(Y;) = 2p — 1 et V(Y;) = 4p(1 — p). Par conséquent : 


n 


E(X») = D, E(Y;) = n(2p — 1) et V(X») = D V(Y:) = Anp(1 — p) 


i=1 i=1 


Exercice 5.10 
Les variables 14 et 13 ont pour loi : 


a! 0 | 1 },[18f] 0 | 1 
rar 
Si À et B sont indépendants, alors À et B le sont aussi, donc : 


P(14=0N18-0) = P(ANB) 


— P(A)P(B) 
= P(14 =0)P(18 = 0) 


On procède de la même façon pour les trois autres vérifications. 


Réciproquement, si les variables 14 et 18 sont indépendantes, alors : 


PANE) = PL =inL 20 


P(14 = 1)P(18 = 1) = P(A)P(B) 


et les événements À et B sont donc indépendants. 


Chapitre VI : Variables aléatoires à densité 


VI.1 - Généralités 


Définition 6.1 Soit À une v.a.r. : on dit que X admet une densité f si 
sa fonction de répartition F est continue et peut s’écrire sous la forme : 


Vz ER, F(x) = [l | f{bdt 


avec : 
1. f est positive. 


2. f possède un nombre fini de points de discontinuité. 


+00 
3. f(é)dt = 1. 


Remarque : f n’est pas unique. Il suffit de la modifier en un point, et on 
obtient une autre fonction vérifiant toutes les conditions de la définition 
(modifier une fonction en un point ne change pas la valeur de l’intégrale). Il 
est donc plus correct de parler d’une densité de X plutôt que de la densité 
de X. 


F' étant une fonction de répartition, elle possède toutes les propriétés 
générales de ces fonctions (limites, régularité...) énoncées au chapitre IT. 

Dans le cas des variables à densité, Fest par définition continue, et possède 
en plus la propriété suivante, qui relie fonction de répartition et densité : 


Propriété 6.1 En tout point xo où f est continue, F' est dérivable et : 
F(&o) = f (to) 
Démonstration : soit x, un point où f est continue. On a donc : 
Ve > 0,1a > 0,|x — xol < a = |f(x) — f(xo)| < € 


Soient e > 0 fixé, et h tel que [h| < a. 
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1 zo+h 
En remarquant que f(xo) = h | f(&o)dzx, on à : 


0 


— zo+h 
AL) FE) _ (20) _ É [ f() — f(æo)dz 
zo+h 
< E[  1@- le 
1 
< he 
< € 


Fo + à) — F(&0) _ 


On a donc bien lim à f(xo) 
Exemple 6.1 Soit f définie par : 
0 si t<0 


: si DO<t<I 
JG) = 4 444 
1 | 
2t? — 
f vérifie les 3 conditions de la définition : elle est positive et discontinue 
en Ü et en 1. De plus : 


E À 1 11 1 1 1 
——— 4 — une 
| = Evil. 2 5 Va 2 


Donc lZ re converge (on le savait sans calcul par le critère de Rie- 


mann), et vaut :. 
De même . 
N 11 —1 1 1 
2 PSE res 
+00 
Donc | 242 À converge (là aussi, on le savait au départ par le critère 


+00 


1 
de Riemann) et vaut 3 Par conséquent, f(t)dt converge et vaut 1. 
On obtient ensuite F : 
0 si æz<0 
1 
F(x) = SV si O<tT<I 


1 
1—-— ss 1< 
x si 1<7x 


Généralités 121 


Remarque importante sur les intégrales généralisées : 
pour une série Ù Un, On Sait que : 


3 un converge — (u,) converge et lim u, = 0 
— +00 


n 
n n—1 

Il suffit d’écrire : u, — Ù UE — Ù Uk. 
k=—0 k=0 


Pour les intégrales généralisées, on n’a pas le même résultat sur le com- 
portement de la fonction à l'infini : 
soit f : (a; +oo[- R continue et positive. Alors : 


ds f(t)dt converge & f(t) —— 0 


t—+00 


a 


En effet, la fonction suivante : 


f(x) 


ne tend pas vers 0 en l'infini et pourtant son intégrale converge : puisque f 
T 
est positive, la fonction x | f(t)dt (définie sur [0; +oo|) est croissante. 
0 


+00 
—— 1 . 
De plus, elle est majorée (par ) À donc elle possède une limite en +oo. 
n=1 
Il n’est même pas nécessaire que la fonction soit bornée : 


f(x) 


2n+1)È---—-—— 


Pre rene me 
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Ce qui est vrai, c’est que si la fonction a une limite, alors cette limite est 
nulle (démontrez-le, par exemple par l’absurde, en supposant que f a une 
limite strictement positive). 
Si on rajoute comme hypothèse que f est uniformément continue, alors la 
convergence de son intégrale implique que f possède une limite en + (et 
cette limite est alors nulle). 


Propriété 6.2 Soit X une v.a.r. de fonction de répartition F', admettant 
f pour densité. Alors, pour tout (a;b) € R° tel que a < b, 


Pa<x<n= | jodt 


Démonstration : 


P(a<X<b) = P(X €]-00;b]) — P(X €] — co; a]) 
F(b) — F(a) 


[0 [so 


| | f(bdt 


Conséquence : pour une variable à densité, la valeur de la probabilité ne 
change pas selon que l’on met des inégalités strictes ou larges : 


P(a<X<b)=P(a<X<b)=P(a<X <b)=P(a<X <b) 


En effet :VaeR, P(X = a) = lim F(t)-—F(a) = 0, et donc par exemple : 


t—at 


P(a<X <b)=P(a<X <b)+P(X = a) = P(a<X <b) 


VI.2 - Espérance et variance d’une v.a.r. à densité 

On a une analogie entre les cas discrets et continus (variable à densité) : 
dans le cas discret, les poids de probabilité étaient les p; = P(X = x;) (et 
on devait donc avoir 3 pi = 1). 


ici 
Dans le cas continu, l’idée est que les poids de probabilités sont donnés 


par les valeurs de la densité f (et on demande donc que la somme de ces 
+00 


poids, c’est-à-dire | f(t)dt, soit égale à 1). 


— CO 
L'unification de ces deux cas se fait par la théorie de l’intégration au sens 
de Lebesgue, puisqu'on a dans les deux cas une mesure et on demande 
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qu’elle soit de masse totale égale à 1. 

Sans faire référence à cette théorie de la mesure (clairement hors du pro- 
gramme), on peut garder à l’esprit l’analogie décrite plus haut, et les for- 
mules qui suivent, si elles ont été comprises dans le cas discret, seront assez 
< naturelles >. 


Définition 6.2 Soit X une v.a.r. de densité f. On appelle espérance de 
X le réel : 


E(X) = | fat 


sous réserve de convergence absolue de cette intégrale. 


Remarque : c’est l’analogue de l'expression de l’espérance dans le cas 
discret E(X) = Ÿ xp 


il 


Exemple 6.2 En reprenant la densité f définie par : 


0 si t<0 

1 

— 8 O<t<I 
fÉ)= 4 AVE 

1 | 

2 sg l1<t 


la v.a.r. X de densité f ne possède pas d'espérance, à cause de la divergence 


+00 1 
d — dt. 
e | 24 
Exemple 6.3 Soit X de densité f définie par 


1 1 
VER, f(t) = 9 X 5 4 Liiroo(() 


On peut vérifier que f est une densité : les conditions de positivité et de 
régularité (discontinuité en t = 1) sont clairement vérifiées. Le calcul de 
l'intégrale se fait par décomposition en éléments simples (on sait qu’elle 


1 
T Fm2/ 


À A 
1 1 l 
| —— dt — | — — ——dt 
y L+É y À +1 


mé in (# +1)] 


converge, puisqu’en +00, f(t) 
soit À > 1 : 


| 
1 


= n (2) -n; 
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en +00, et vaut : 


1 
E(X) existe, puisque tf(t) équivaut à no 


| 1 +00 LL 
PRET 
di ni. t +1 218: 4n2 


Pour l'espérance, on a les mêmes propriétés que dans le cas discret, mais 
elles sont délicates à démontrer sans faire appel à la théorie de la mesure 


(E(X) = | XdP). Par contre, on n’a plus de structure d’espace vecto- 


Q 
riel : la somme de deux variables à densité n’est pas nécessairement une 
variable à densité (considérer X — X par exemple). On donne donc sans 
démonstration les deux résultats suivants : 


Propriété 6.3 Linéarité de FE. 
Soient À et Y deux v.a.r. à densité admettant une espérance, et soit À un 
réel. Alors À + ÀY admet une espérance, et : 


E(X +)Y)=E(X)+XE(Y) 


Théorème 6.1 Théorème de transfert. 
Soient À une v.a.r. de densité f et ® une fonction de R dans R telle que 
|d|f soit intégrable sur R. Alors @(X) possède une espérance, et : 


+00 


E(a(X)) = p(x)f(x)dz 


— OO 


Pour la variance et le moment d’ordre 2, on a aussi les mêmes définitions 
et les mêmes résultats que dans le cas discret : 


Définition 6.3 Soit X de densité f. On appelle moment d'ordre 2 l’espé- 
rance, si elle existe, de la variable X°. 
C’est donc le réel, d’après le théorème de transfert : 


E(X*°) — 1. x” f(x)dx 


— CO 


sous réserve de convergence de cette intégrale. 


Propriété 6.4 Si X possède un moment d'ordre 2, alors X possède une 
espérance. 


Démonstration : identique au cas discret (écrire que pour tout réel x, 
xl < x? +1). 
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Définition 6.4 Soit X de densité f. On appelle variance de X l'espérance, 
si elle existe, de la variable (X — E(X))°. 
En vertu du théorème de transfert, c’est le réel : 


vQo= [(e- 800): 


— OO 


sous réserve de convergence de cette intégrale. 


Comme dans le cas discret, l’existence du moment d’ordre 2 équivaut à 
celle de la variance, et le calcul effectif se fait souvent avec la formule de 
Koenig : 


V(X) = E(X?) — (E(X)) 
Démonstration analogue au cas discret. 


On donne ensuite, comme dans le cas discret, les lois à densité usuelles 
au programme avec leurs principales caractéristiques. 


VI.3 - Loi uniforme sur |{a; b] 


Définition 6.5 X suit la loi uniforme sur |a;b] si elle a pour densité f 
définie par : 


si xE {a;b] 


0 si x [a;bl 
1 


On note alors : X + U([a; b]). 


On obtient sans difficulté : 


Propriété 6.5 Sa fonction de répartition est la fonction : 


0 Si T<a 
1 
F(x) = sua) si a<zx<b 
1 Si xz>b 


ainsi que son espérance et sa variance : 


Propriété 6.6 


(b—a) 
12 


E(X) = a + b 


et V(X) — 
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VI.4 - Loi exponentielle 


Définition 6.6 Soit À > 0. X suit la loi exponentielle de paramètre À si 
elle a pour densité : 


0 si T<0Û 
fe) = {ee si +æ>0 


On note alors : X  E(À). 


f est bien une densité : on a directement par le calcul la convergence de 
+00 


f(t)dt et sa valeur. 
Propriété 6.7 Sa fonction de répartition est : 
0 si æ<0Û 
F(e) = { 1—e Ÿ gi x>0 


En procédant par exemple à des intégrations par parties, on obtient l’espé- 
rance et la variance : 
Propriété 6.8 


E(X) = + et V(X)= = 


Cette loi apparaît dans la partie 3 de l'épreuve 1 du CAPES 2001, où on 
la trouvait dans un contexte usuel : on s’intéressait à l’arrivée de messages 
dans un réseau informatique. Ti était le temps d’attente depuis l'instant 
initial et pour k > 2, T4 était le temps d’attente du k*"* message depuis 
l’arrivée du (k — 1)*7*, L'hypothèse était que : 


Vk > 1,7 r E(X) 


et que ces variables sont indépendantes. On démontrait dans ce sujet que 
la loi exponentielle est « sans mémoire >», c’est-à-dire qu’elle vérifie : 


Propriété 6.9 Soit X = E(À). Alors : 
VsER,Vt>0,P(X >s+t/X >t) = P(X >Ss) 


De plus, cette propriété caractérise la loi exponentielle. 
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Démonstration : voir l'exercice 6.8. 


VL.5 - Loi normale, ou loi de (Laplace-) Gauss 


C’est une loi fondamentale car elle apparaît comme <« loi limite > dans 
de très nombreuses situations, en vertu du Théorème Central Limite, que 
l’on abordera dans le chapitre sur les convergences de suites de variables 
aléatoires. 


Définition 6.7 X suit la loi normale centrée réduite si elle a pour densité 
f définie par : 
1 72 


Vz ER, f(x) = = 


On note alors : X = N(0;1). 


On peut vérifier que f est bien une densité : 
+00 


+00 
f étant paire, | f(x)dx converge si et seulement si (x)dx con- 
ee 0 

1 

verge. Or c’est bien le cas puisque f(x) = o (=). 
T—+00 \ T 

Pour le calcul de l’intégrale, le problème est que la fonction f ne possède pas 
de primitive <« usuelle > permettant de mener le calcul et on n’y parvient 
pas avec des intégrations par parties ou des changements de variables. 
Attention : f étant continue sur R, elle possède bien des primitives (et 


même une infinité !). 
+00 2 
On donne ici une façon très classique de calculer eZ? dx, qu'il est 


0 
bon d’avoir vue une fois : l’idée est de passer dans le plan, et d'utiliser les 
coordonnées polaires. 

(#2 


2? 
On pose, pour a > 0 : J(a) — | e_ 7 dx. 


0 
On a, par le théorème de Fubini : 


(T(a))? = (f e"F dx) (f e"* dy) = [[.. a du 


On ne peut pas passer facilement en coordonnées polaires puisqu'on intègre 
sur le carré [0; a] x [0; a]. On va intégrer sur le quart de disque en posant : 


D, — { (r cos; r sin @)/r e [Wah e C 21) 


On peut alors calculer, en posant x = r cos 0 et y = r sin 0 : 


J(a) = |. di = Î] eTrdrdô 
5 [0;a] x oz. 
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En utilisant de nouveau le théorème de Fubini, on obtient : 


J(a) = (f do (fre ar) — Se] — = (1 -e#) 


et donc: lim J(a) = — 

a—++00 
On encadre ensuite (J/(a))*. On a : D, C [0;af° € D,,5, et comme la fonc- 
tion intégrée est positive : 


J(a) < (I(a))° < J(av2) 


\ ._. T 
En passant à la limite, par encadrement, (1(a))° aveu 5 et on a donc 
a—} +00 


+00 _32 
| e 2 dx = e 
0 2 


Conclusion : 


Remarque : une autre méthode classique est exposée dans l'exercice 6.6. 


La fonction de répartition n’a pas d'expression <« explicite > à l’aide des 
fonctions usuelles. 
Elle est donc donnée sous la forme d’une table fournie à À la fin de ce cha- 


pitre, où sont rassemblées des valeurs approchées de = dt 


— 00 V2 
Propriété 6.10 
E(X) = 0 et V(X) — 


+00 
Démonstration : l'existence de | x f(x)dzx est assurée par le fait que la 
— CO) 


1 
fonction x + xf(x) est continue et qu’en l'infini, xf(x) = o (=) Comme 


elle est impaire, on a bien : 


+00 1 2 
2 
z——e 7 dx = 0 
V27 
+00 
Pour la variance, l’existence de | zx° f(x)dx est assurée pour la même 
— OO 


raison et le calcul se fait en intégrant par parties (poser u = x et v' = 


x? 


ze? ). 


Remarque : cela explique la notation W(0;1) : 0 est l'espérance de X 
et 1 est son écart-type. 
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Définition 6.8 Soient m € R et o > 0. X suit une loi normale de pa- 
ramètre m et o s1 elle a pour densité : 


On note alors : X x N(m; a). 
On se ramène à la loi normale centrée réduite grâce à la propriété suivante : 


Propriété 6.11 


X-m 


X = N(mo)s n N(0;1) 


Démonstration : si À suit une loi W(m;o), alors pour tout réel y : 
X —-m Yom. 7] ne 
P( <y)=P(X< o+m)= | —e 27 TX 
y (X < y ) TE | 


L 


, on obtient : 


—_ y 2 
P( Le y) = | 16% 
O 


Lo V2T 


En posant t — 


— m . L. 2 
La variable a donc pour densité t > ——e 5 et elle suit donc une 


V2 
loi (0; 1). 


La réciproque se démontre de la même façon. 

On en déduit l’espérance et la variance : 

Propriété 6.12 Soit X = N(m;0). Alors E(X) = m et V(X) = 0°. 
Démonstration : 


X © N(m;0) = 
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. \ SE mm . / / . 
Lorsqu'on considère , on dit que l’on a centré et réduit X. 


VI.6G - Enoncé des exercices 


? 
Exercice 6.1 Soit X de loi uniforme sur 1: =. 


Déterminer la loi de X°. 


Exercice 6.2 1. Soit X une v.a.r. dont la fonction de répartition F' est 
strictement croissante et continue sur KR. 
Déterminer la loi de Y = Fo X. 

2. Soit X de loi uniforme sur ]0;1[. Soit F' une fonction de répartition. 
On définit « F7! > par : 


Vz €]0;1[, F7 (x) = inf{y/F(y) > x} 


Préciser pourquoi cette définition a bien un sens, et montrer que la va- 
riable aléatoire Z = Flo X a pour fonction de répartition F. 


Remarque : ce résultat est d’une grande importance < pratique > : on peut 
simuler la fonction de répartition de n'importe quelle variable aléatoire à 
partir de la loi uniforme sur [0; 1] ; il suffit de générer des nombres au 
hasard entre 0 et 1, et de composer par « F7! >, ce qui est aisé lorsque F 
est bijective. 


Exercice 6.3 1. Soit X une v.a.r. de loi N(20;2). À l’aide de la table de 
la loi N(0;1), donner P(X > 21), P(17 < X) et P(18 < X < 20.5), 
puis déterminer x tel que P(20 — x < X < 20 + x) = 0.95. 


2. Soit X une v.a.r. de loi N(m;o). Déterminer P(|X — m| > 20). 


Exercice 6.4 Soit a > 0 fité et X une v.a.r. de loi N(m;0). 
Déterminer b pour que P(b < X < b+ a) soit maximale. 
Exercice 6.5 Soit X de loi uniforme sur | n : | 
1. Déterminer la loi de ŸY = tan X. Cette loi est appelée loi de Cauchy. 
2. Y possède-t-elle une espérance ? 

+00 ; 
Exercice 6.6 Une autre façon de calculer l'intégrale de Gauss | e* dt 

0 
(pas de probabilités dans cet exercice, mais des outils classiques d'analyse). 
Soit : 
[0;+oo[ — R 


1 ,—(t?+1)x? 
x HR | ee) 
… Hi 
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1. Montrer que g est dérivable, et exprimer g en fonction de f définie par : 
T o | 
Vz > 0, f(x) — | e * dt 
0 


2. En encadrant g(x), montrer que g(x) — 0. 
T—}+00 


3. En déduire la limite de f en +oo. 


Exercice 6.7 Soit f définie sur R par f(x) = ae "1. 


1. Déterminer a pour que f soit une densité de probabilité. 
Soit À une v.a.r. de densité f : on dit que X suit une loi de Laplace. 


2. Montrer que X a des moments de tout ordre et que : 


1 +00 
VE > 1, E(X*) = 5 (1+ (-1)) ‘ etat 
0 


On retrouve donc la très classique fonction T : 
+00 
l':zr | le tdt 
0 


3. Montrer que T est définie sur ]0; +oo{ et que Vx > 0, (x + 1) = xl'(x). 
4. En déduire E(X"), et en particulier l’espérance et la variance d’une 
variable qui suit une loi de Laplace. 


(Dans vos révisions, faites absolument un problème sur la fonction |’, c’est 
une très bonne façon de s'entraîner à utiliser des théorèmes et des tech- 
niques classiques d'analyse : montrez qu'elle est de classe C®° et convexe 
sur ]0;+oco[, déterminez un équivalent en OT... 


Exercice 6.8 Caractérisation de la loi exponentielle par son absence de 
mémoire. 
Montrer que X suit une loi exponentielle si et seulement s1 : 


VsER,V>0,P(X >s+t/X >t)=P(X >Ss) 


Exercice 6.9 Soient X1,..,X, des v.a.r. indépendantes qui suivent toutes 
une loi uniforme sur [0; 1]. Soit Y = max {X;}. 
<i<n 


Déterminer la loi de Y. 


132 Variables aléatoires à densité 


VI.7 - Correction des exercices 
Exercice 6.1 


2 
On détermine la fonction de répartition de X° : X(N) — 1: 3 ; donc 


X?2(Q) = [0;1]. On en déduit que si y < 0, P(X? < y) = 0, et que si y > 1, 
P(X? < y) = 1. 
Soit F' la fonction de répartition de X et soit y € [0; 1] : 


P(X° <y)= PC-YGSX< Vy) = F(Vy) - F(- V9) 


Or on connaît F': 


0 si æ< —1 
3 2 
F(x) = e(® +1) si —-1<xz< 3 
2 
1 > — 
si T>2 
; . À 2 
Par conséquent : si 0 < y < 9° 0 < y < 3 et donc 


F(VD) = F(-VD = E(V5 +0  E(-V5 + 0) = SVT 


ND 


4 
ts <y£<ls<Vy£I d'où: 


F(VD) = F(-VD = 1 - E(-V5+ 0) = EV5 + 


Conclusion : X° suit une loi dont la fonction de répartition G est définie 
par : 


0 st y<OÛ 

6 4 

= VY si O<y<- 
Gun) = d S 9 

@)= 4 3 0 4 

= Log =<y< 

EVYTE si j <Y<1 

1 si 1<7Yy 


Une densité g de X° s'obtient alors en dérivant G en tout point où elle est 
dérivable, et en donnant n'importe quelle valeur à g aux points où G n’est 
pas dérivable (quels sont ces points ?...). 
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Exercice 6.2 

1. Comme Fest une fonction de répartition, elle est à valeurs dans [0; 1], 
donc si y < 0, alors P(F o X < y) =0, et siy > 1, P(FoX <y)= 1. 
Soit y € [0; 1] : 


P(Y <y)=P(FoX <y)=P(X < F(y)) = F(F(y)) = y 


(F étant continue et strictement croissante, elle est bijective et F7! est 
strictement croissante). Ÿ a donc pour fonction de répartition : 


0 si y<Û 
Gy) = 4 y si yEe(0;1] 
1 si y>1 


et donc Y + Ub:1]. 

2. On note, pour tout x €l0;1[, 4, = {y € R/F(y) > x}. 
Comme F' est une fonction de répartition, elle tend vers 1 en +oo et À, 
est donc non vide. 
Si À, n’est pas minoré, on peut trouver une suite (u,) d'éléments de 
A; qui tend vers —oo. Or : 


Un € Az > Fun) > x 


Comme F tend vers 0 en —0o, la suite (F(u,)) tend vers 0, et on a, en 
passant à la limite : 0 > x, ce qui est absurde. 

L'ensemble À, est donc minoré. 

Comme l’ensemble À, est une partie non vide et minorée de R, il possède 
une borne inférieure. 


Remarque : il existe des ensembles dont les parties non vides minorées 
ne possèdent pas nécessairement de borne inférieure, comme l’ensemble 
Q : vous pouvez par exemple considérer 


A={xeQ/r° <2} 


et montrer que À est non vide, minorée, et ne possède pas de borne 
inférieure. 


Soient x El0;1[ et z ER. On a: 
F\(x)<z&zx< F(2) 


En effet, si x < F(z), alors z € À,, et donc z > F7"(x). 
Réciproquement, si z > F7{(x) : par définition de la borne inférieure, 
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il existe une suite décroissante (u,) d'éléments de À, qui converge vers 
F'(x). On a donc, pour tout n, F(u,) > x, et en passant à la limite, 
comme F' est continue à droite : F(F7{{(x)) > x. 

Comme 2 > F(x), F(2) > F(FT\(x)), donc F(2) > x. 

On en déduit la fonction de répartition de la v.a.r. Flo X : 


P(F loX<2) = P(X<F(2)) 
= F(2) (car X = War) 


Flo X a donc pour fonction de répartition F. 


Exercice 6.3 
Les résultats numériques s’obtiennent par lecture sur la table qui donne 
des valeurs approchées de la fonction de répartition de la loi W(0;1) (et 
en utilisant la parité de la densité). 

X — 20 


1. On note X* la variable centrée réduite associée à X : X* —  — 


- P(X > 21) — P(x > =) ce 1 — 0.6915. 


_- P(17< X)— P(— < > — P(x < =) ce 0.9332. 


— On développe : 

P(18 < X <20.5) — P(—1< X* < 0.25) 
P(X* < 0.25) — P(X* < -1) 
œ  0.5987 — (1 — 0.8413) = 0.44 


— On obtient x par lecture sur la table : 


P(20—-x<X<20+7x) = 0.95 


TL T 
Æcx<t) = 0 
8 P( s<X"<=- 0.95 
8 P(x" < 2) = 0.975 
ss œ 1.96 


2. Le résultat numérique qui suit est à comparer avec la majoration fournie 
par l'inégalité de Bienaymé-Tchebychev (Chapitre VIIT). 
P(IX -m|>20) = P(IX*|>2)=2P(X* > 02) 
2(1 — 0.9772) + 0.0456 


Exercice 6.4 
Soit g définie sur R par g(b) = P(b< X <b+a). On note Ÿ la fonction 
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de répartition de X : 


gi 1 _ (t-m)2 
e 202 dt 


Vxz ER, d(x) — ji 


OV AT 


On a donc g(b) = @(b + a) — p(b). On étudie les variations de g : 


1 (b+a-m)? (b—m)? 
é b — (e- 2o + e. 20 ) 
g (b) = - : 


D'où le signe de g : 


g(b)>0 & (b+a-m) <(b-m) 


& a*+2a(b—m) <0 
ss bême 
— 2 


Le tableau de variations de g est donc : 


| a 
et g est maximale pour b = m — —. 


On pouvait obtenir le résultat graphiquement en traçant la densité de X : 


FIGURE 6.1 — Loi normale 
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Exercice 6.5 
La fonction de répartition de X est donnée par : 


| FT 
0 si T£— 
T 2 27 2 
, ST 
si T2% 


Soit y € R : 
1 
P(Y < y) = P(tan X < y) = P(X < arctan y) = = (arctan y + =) 


On obtient une densité g de Ÿ en dérivant sa fonction de répartition : 


Vy ER, g(y) = 1 +) 


| / 1 Q A 0 
Ÿ ne possède pas d’espérance car xg(x) 7  —;,ce qui entraîne la diver- 
T—+oo TT 
+00 


+00 
gence de | xg(x)dx et donc celle de | xg(x)dz. 
1 — OO 
Remarque : la densité est pourtant une fonction paire, donc la distri- 
bution est « équilibrée > autour de 0. On pourrait être tenté de conclure 
hâtivement que l’espérance est nulle, mais celle-ci n’existe pas. 


Exercice 6.6 
1. La fonction de deux variables : 
[0,1] x RT — ne 
® e” t*+1)x 
Ga) 9 
admet une dérivée partielle par rapport à x qui est continue. 
Le théorème de dérivabilité sous le signe intégral (l'intervalle d’intégra- 


tion étant le segment [0; 1]) permet d’en déduire que g est dérivable sur 
R' et que Yx > O, 


/ 0 ; —(t2+1)xz? —x? —t2x? 
g (x) = 37 t)dt = | —2xe dt = —-2xe e* dt 
o OZ 0 0 


En effectuant le changement de variables u = tx dans l’intégrale, on fait 
apparaître f : 


Vz > 0,g'(x) — 2e Î[ e"* du — —2f'(x)f(x) 
0 


Correction des exercices 137 


En intégrant :1C€R,Vx > 0, g(x) = —f*(x) +C. 


T 
L'évaluation en x = 0 donne C = rl 


Remarque : le fait que deux fonctions ayant des dérivées égales diffè- 
rent d’une constante peut être faux si l’on n’est pas sur un intervalle : 


1 si xel0;il 1 si xel0;1l 
hors À RL di 3 si rel2;3l 
sont telles que : Vx €]0; 1[U]2; 3[, h'(x) = k'(x). Pourtant, il n’existe pas 
de constante C telle que : 
Vz €]0; 1[U/2; 3[, h(x) = k(x) + C 


1 
2. On encadre g : 0 < g(x) < “ut dt, soit : 
0 


1+1t2 
0 < g(x) < 


et par encadrement lim g(x) = 0. 
T—}+00 
: 2 T , ia t2 TH 
3. On a donc lim f“(x) = —, c’est-à-dire : | ee d=i]—. 


Exercice 6.7 
+00 


1. Il faut que | ae Fldx converge vers 1. Comme f est continue et 


—O0 
+00 


que f(x) = o (5): on a l'existence de | f(x)dxr. Comme f est 


T— +00 

paire, on a l’existence de son intégrale sur R, et : 

+00 +00 

(x)dx = 2 | ae “dx = 2a 

—O00 0 
1 
7 
2. Vk > 1, la fonction x ze” ll est continue sur : et négligeable en 

OO 


d’où a = 


1 
l'infini devant x + —, donc on a l'existence de | ate”lax. 
T —00 
On calcule le moment d’ordre k : 
+00 1 
E(X*) = [l ste "dt 


OO 


1 0 +00 
— = ( | tFetdt + | tée-tdt) 
2 — O0 0 


1 Le 
= =((—1) + 1 | tfe-tdt 
2 0 
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3. Au voisinage de 0, on a {let & #71 donc la fonction est intégrable 
au voisinage de 0 si et seulement si x — 1 > —1 (critère de Riemann). 
En +0, t*"le”t est négligeable devant —, donc la fonction est intégrable 


au voisinage de +co, et comme elle est continue sur ]0; +co{, on a fina- 
lement : 


+00 
| le tdt existe & x > 0 
0 
Une intégration par parties donne : 
+00 +00 
(x + 1) = | tre dt = [-Fe | + | rt le tdt = xl(x) 
0 0 


4. Comme l'(1) = 1, on en déduit que Vk > 1,T(k +1) = K!. 
Par conséquent : 


E(X®) = (1 + (—1)S)T(k +1) = ( + (—1)*)kl! 
En particulier E(X) = 0 et V(X) = 2. 


Exercice 6.8 
On suppose que X suit une loi exponentielle E(À). Par définition de la 


probabilité conditionnelle : 
P(X >s+INX>t) 
Vs ER,Vt>0,P XD) = ——— 
SER,V>0,P(X >s+t/X >t) PIX > à 


Si s > 0, alors : 


P(X>s+INX>t)  P(X>s+t) 
P(X >t) __ P(X >t) 

e”\(s+t) 

—_ es 


= P(X>Ss) 
Si s < 0, alors À > t—= X > s+t, et donc : 
P(X > t) 
P(X LX>t)= —— =] 
ŒA>sHUXZI)= TS 
Comme P(X > s) — 1, on a l’égalité souhaitée. 
Réciproquement, en notant F la fonction de répartition, l'hypothèse s'écrit, 


1-F l 
SL — 1 — F(s), soit, en posant G = 1-F': 


Vs > 0, Vt > 0,G(s +t) = G(s)G(t) 


dans le cas où s > O0: 
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On reconnaît l’équation fonctionnelle caractérisant les fonctions exponen- 

tielles : a ER, Vt > 0,G(t) = e*!. 

Comme im F(t) = 1, G(t) tend vers 0 et a est strictement négatif. En 
—+ 700 


posant À = —-a > 0: 
V>O0,F(t)=1-e * 
Il reste à montrer que F est nulle sur | — co; 0| : 


P(X>s+INX>t) P(X>t 


Ou 
° P(X > t) P(X >t 


donc P(X > s) = 1 et on a bien F(s) = P(X < 5) = 0. 
Conclusion : À suit une loi exponentielle. 


Exercice 6.9 
On a Y(Q) = [0;1]. Soit y € [0;1]. Grâce à l'indépendance des X;, on 
obtient : 


P(Y <y)= (Aa) - IT PC < y) = y" 
i=1 
Y a donc pour fonction de répartition : 


0 si y<O 
Gly) = 4 y" si O<y<Il 
1 si 1<y 
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Loi normale centrée réduite 


Le tableau donne avec une précision de 107“ les valeurs de la fonction de 


1 T 
répartition de la loi normale centrée réduite : F(x) = = | et"? dt. 
T Jo 


0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09 
0.504 0.508 0.512 0.516 0.5199 0.5239 0.5279 0.5319  0.5359 
0.5398  0.5438  0.5478 0.5517 0.5557 0.5596 0.5636  0.5675  0.5714  0.5753 
0.5793 0.5832 0.5871 0.591  0.5948  0.5987  0.6026  0.6064  0.6103  0.6141 
0.6179 0.6217  0.6255  0.6293  0.6331 0.6368  0.6406  0.6443 0.648  0.6517 
0.6554  0.6591 0.6628  0.6664 0.67 0.6736 0.6772  0.6808  0.6844 
0.6915 0.695  0.6985  0.7019 0.7088  0.7123 0.7157 0.719  0.7224 
0.7257 0.7291 0.7324 0.7357 0.7389 0.7422 0.7454 0.7486 0.7517  0.7549 
0.758  0.7611 0.7642 0.7673 0.7704 0.7734 0.7764 0.7794 0.7823  0.7852 
0.7881 0.791 0.7939 0.7967 0.7995  0.8023 0.8051  0.8078  0.8106 
0.8159  0.8186 0.8212  0.8238 0.8315 0.834  0.8365 
0.8413 0.8438 0.8461  0.8485 0.8531 0.8554 0.8577 0.8599  0.8621 
0.8643  0.8665  0.8686 0.8708 0.8729 (0.8749 0.877 0.879 0.881 0.883 
0.8849  0.8869  0.8888  0.8907  0.8925  0.8944  0.8962 (0.898  0.8997  0.9015 
0.9032  0.9049  0.9066  0.9082  0.9099  0.9115  0.9131 0.9147 0.9162  0.9177 
0.9192 0.9207 0.9222  0.9236 0.9279 0.9292  0.9306 
0.9332 0.9345 0.9357 0.937 0.9406  0.9418 0.9429  0.9441 
0.9452  0.9463 0.9474 0.9484 0.9495  0.9505  0.9515  0.9525 0.9535  0.9545 
0.9554  0.9564 0.9573 0.9582 0.9591 0.9599 0.9608  0.9616 0.9625  0.9633 
0.9641  0.9649  0.9656  0.9664  0.9671 0.9678  0.9686  0.9693  0.9699  0.9706 
0.9713 0.9719 0.9726  0.9732 0.975  0.9756  0.9761 
0.9772 0.9778 0.9783  0.9788 0.9803  0.9808  0.9812  0.9817 
0.9821  0.9826 0.983  (0.9834 0.9838  0.9842 0.9846 0.985  0.9854  0.9857 
0.9861  0.9864  0.9868  0.9871 0.9875  0.9878 0.9881 0.9884 0.9887 0.989 
0.9893  0.9896  0.9898  0.9901  0.9904  0.9906  0.9909  0.9911 0.9913  0.9916 
0.9918 0.992 0.9922  0.9925 0.9931 0.9932  0.9934 
0.9938 0.994  0.9941  0.9943 0.9946  0.9948  0.9949  0.9951  0.9952 
0.9953  0.9955  0.9956  0.9957  0.9959 0.996  0.9961  0.9962 0.9963  0.9964 
0.9965  0.9966  0.9967  0.9968  0.9969 0.997  0.9971 0.9972 0.9973  0.9974 
0.9974  0.9975  0.9976  0.9977 0.9977  0.9978  0.9979  0.9979 0.998  0.9981 
0.9981  0.9982 0.9982  0.9983 0.9985  0.9985  0.9986 
0.9987 0.9987  0.9988 0.9989  0.9989 0.999 


0.9988  0.9989 0.999 


Exemple : F(1.12) + 0.8686. 


Chapitre VII : Vecteurs aléatoires à densité 


VII.1 - Généralités en dimension 2 


Définition 7.1 Un vecteur aléatoire V : 2 R 
| lw + (X{(w),Y(w)) 


une densité s'il existe une fonction f : R° — R positive, dont l'intégrale 
sur R° existe et vaut 1, et telle que : 


admet 


a pl 
V(a; B) € R°,P(X <anY < B) = | [l f(x; y)dzdy 


Exemple 7.1 f définie par : 
e EH) 8 zx>0ety>0 


fG:y) = { (0 sinon 


est positive et son intégrale sur R° vaut bien 1 : 


+00 +00 
ll [l Ets died | ed / eVdy=1 
R2 0 0 


Exemple 7.2 Soient R > 0 et f définie par : 


je) = | _. si  (x;y) € D(O;R) 


0 sinon 


Il est immédiat de vérifier que f est une densité. On dit naturellement d'un 
couple (X;Ÿ) ayant pour densité cette fonction f qu'il suit la loi uniforme 
sur le disque D(0; R). 


Propriété 7.1 Soit (X;Y) un couple de densité f. À et Y sont alors des 
variables à densité, dont une densité pour X est : 


+00 


fxiin f(x; y)dy 
et une densité pour YŸ est : 
+00 
fr :yr f(x; y)dx 


TOO 


142 Vecteurs aléatoires à densité 


Démonstration : soit «& € KR. 


P(X <a) = P(X<anY ER) 


+00 
- |. k, féu)drd 
— [ ([ . Fr (x; y)dy) dx (Théorème de Fubini) 


Définition 7.2 Les fonctions fx et fy sont appelées densités marginales 
du couple (X;Y). 
Exemple 7.3 Soit (X;Y) de densité f vis par : 

V(z;y) ER?, f(x;y) = Je Rue) 


On dit que le vecteur (X;Y) suit une loi normale centrée réduite en di- 
mension 2. À a pour densité : 


fx(x) Î de eng = er (l 7 Le 

T) = — = — a 

À 2° V?r on V2r y 
Nm, me” 


On remarque en particulier que X + N(0;1). 


VII.2 - Indépendance de 2 variables à densité 
On rappelle la définition vue au chapitre IT : 


Définition 7.3 Deux v.a.r. X et Y définies sur le même espace probabilisé 
sont indépendantes si : 


V(B:; Bo) € (Br), P(X € B\NY € B:) = P(X € B:)P(Y € Bo) 


La tribu des boréliens de R étant engendrée par {] — co; a],a € R}, il est 
équivalent de vérifier que : 


V(a; B)E R°,P(X <anY <B)= P(X < a)P(Y < 6) 
Comme dans le cas discret, on a une caractérisation plus simple : 


Théorème 7.1 Si X et Y sont indépendantes, de densité fx et fy, alors 
le couple (X;,Y } a pour densité f = fxfy. 

Réciproquement, soit V — (X;Y) de densité f. Si f se factorise sous 
la forme : V(x;y) ER, f(x;y) = g(x)h(y), où g et h sont positives et 
intégrables sur R, alors X et Y sont indépendantes et : 


1 
3) > 0, fx = Àg tfy= h 
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Démonstration : soient X et Ÿ indépendantes, de densité fx et fy : 


V(a;B)EeR°,P(X <anY <B) = P(X < a)P(Y < 6) 


|. fx(x af” fr (y 


Î[ fx (x) fr (u)drdy 
]-00,a] x]—00,6] 


Réciproquement, si (X;Y) a une densité f qui s'écrit : V(x;y) € R°, 
f(x; y) = g(x)h(y), où g et h sont positives et intégrables sur R, alors : 


Vr ER, fx(x )= find = ven 


De plus : 


[l ] f(x; y)drdy = 1 = Î h(y)dy | g(x)dx = 


1 
Donc À est bien strictement positif et £ g(x)dx = 
R 


> | 


On a alors fy(y) = | f(x; y)dx = h(y) | g(x)dx — 20) Les variables 
R 


X et Y sont indépendantes puisque : 
(1 B 
[. [. f(x; y)dxdy 


É. fx(x)dz [ fy(y)dy 


— P(X < a)P(Y < B) 


V(a:B) E R°,P(X <anY < B) 


Remarque : bien voir l’analogie avec le cas discret, où l’on avait la « fac- 
torisation > D;,; — Di,.D.,j. 


Exemple 7.4 Soit V =(X;Y) de densité f définie par : 


e EH) g$ x>0ety>0 


f(:y) = { 0 sinon 


X et Y sont indépendantes, car f s'écrit : 


V(x;y) € R°, f(x; y) = (e*Lto:+00(T))(e Ÿ110;+00[(V)) 
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etre “ll;+(x) est bien positive et intégrable sur R. 
Comme son intégrale sur R vaut 1, on a les densités marginales : 


fx(x) = e Lo+(x) = fr(x) 
(A = 1) 
La suite de ce chapitre ne concerne que les candidats à l’Agrégation Interne. 
Néanmoins, elle peut intéresser les candidats au CAPES, puisqu'elle fait 


intervenir des outils classiques, comme le produit de convolution que l’on 
retrouvait dans l’épreuve 1 du CAPES 2001. 


VII.3 - Densité d’une somme de 2 variables à densité 


Théorème 7.2 Soient X et Y deux variables de densité respectives f et 
g. 
Si À et ŸY sont indépendantes, alors À + Y est une variable aléatoire à 
densité, dont une densité est : 

+00 


hit f(æ)g(t — x)dt 


— OO 


c’est-à-dire : h = f + g, produit de convolution de f et g. 


Démonstration : comme X et Ÿ sont indépendantes, le couple (X;Y) a 
une densité qui s'écrit d(x; y) = f(x)g(y). Soit & € R. On intègre la densité 
sur le domaine À = {(x;y) € R°/x +y < a} : 


PO+Y <a) = ]f dimardy = [ (fat) rte 


— 00 —00 


On pose t=zx+7y: 


P(X+Y <a) = [” (96 — r)dt) f(x)dr 
— [. (17 g(t — )f(x)dx) dt 
a , ——] 


h(+t) 


VII.4 - Vecteur aléatoire à densité en dimension p 
On étend la définition vue dans le cas p = 2. 


Définition 7.4 Un vecteur aléatoire V = (X1;-:-; X,) admet une densité 
s'il existe une fonction f : R7 —R positine, dont l'intégrale sur R? existe 
et vaut 1, et telle que : pour tout (a1::--;a) € R?, 


P({x < &) =. -[” ft; T%)dt1 "dt 
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Le théorème de transfert se généralise également : 


Théorème 7.3 Soit X =(X:;,:..; X,) un vecteur aléatoire de densité f. 
Soient g : R° — R continue, et À un domaine « géométriquement simple > de 
R?, tels que |g|1af soit intégrable sur R?. 

Alors (g1a)(X) est une variable aléatoire réelle, d'espérance : 


E((g1a)(X)) = / ges) feu :2)dm de, 


Ce théorème est admis. 


Exemple 7.5 Soit (X;Y) un vecteur de densité f. En appliquant le théo- 
rème précédent avec À = R° et g : (x;y) — x, on a que, si (x;y) — 
xf(x;y) est intégrable sur R° : 


200 = ff sr 


VIL.5 - Indépendance de » variables à densité 
On rappelle la définition générale, pour des v.a.r. quelconques : 


Définition 7.5 Les v.a.r. X1,:::,X, sont indépendantes si pour tout en- 
semble d'indices I C [1;:--;n], on a, pour tout (Biser € (Br)! 


(0x (8) Tr (x (8) 
ieT iel 
Comme dans le cas de deux variables, cette condition équivaut à : 


VICIL:..;n], Vier € R°7, P fn < s) = [[P(X: < «) 


ici 


Le théorème de « factorisation > vu pour un couple se généralise aussi : 


Théorème 7.4 Si X:,-:-,X, sont indépendantes de densités respectives 
X: p 
fx," ,/{x,, alors le vecteur V — : a pour densité [I fx. 
X, i=1 
X1 
Réciproquement, si V — a une densité f qui s'écrit : 
Xp 


Vtis tp) € RP, ft:  Tp) = fi(t1) :** fp(X) 
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où les f; sont positives et intégrables sur R, alors X1,---,X, sont indépen- 
dantes, et : 


p 
(5; 7) € (Ri)? tels que [[ À = 1 et Vi, fx, = x f: 
i=1 
Démonstration : analogue au cas de deux variables. 


VII.6 - Covariance et coefficient de corrélation 


Propriété 7.2 Soit (X;,Y) un vecteur de densité f. 
Si (z;y) > |zylf(x;y) est intégrable sur R°, alors XY est une v.a.r. 
d'espérance : 


E(XY) = [l (l _Tyf (x; y)drdy 


Démonstration : on applique le théorème de transfert avec g(x; y) = xy. 


Définition 7.6 Soit (X;Y) un couple de v.a.r. de densité f, tel que X et 
Y admettent une espérance. On appelle covariance de (X; Y ) le réel : 


Cov(X;Y)= E(XY)- E(X)E(Y) 


sous réserve d'existence de E(XY ). 
D'après le théorème de transfert, c’est le réel : 


CoxiY)= | Jsurtindré— | (l efndrdy | | uf(arv)rdy 


sous réserve d'intégrabilité des fonctions en jeu. 
On a le même résultat que dans le cas discret : 


Propriété 7.3 Si X et Y sont indépendantes, alors Cov(X; Y ) = 0, et la 
réciproque est fausse. 


Démonstration : l'indépendance de X et Ÿ entraîne que f = fx fy, d’où : 
E(XY) = [| suf(siv)drdy 
R?2 
]frutxtortr (dry 


— Jetons | ufr (as 
— E(X)E(Y) 


La nullité de la covariance n’entraîne pas l’indépendance : voir exercice 
7.3. 
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Définition 7.7 Soient X et Y possédant une variance (strictement posi- 
tive). On appelle coefficient de corrélation de X et Y le réel : 


Cov(X;Y) 


VII.7 - Espérance et variance d’une somme de » va- 
riables à densité 


En général, la somme de p variables à densité n’est pas une variable à 
densité (prendre X + (—X)). Le calcul de l’espérance et de la variance se 


p p 
fait de la même façon que dans le cas discret : E(S[ x) = > E(X;) et 
i=1 i=1 


"(5 x;) = > (Xi) + Ÿ Cov(X;; X;). 


iÉ 
VII.S - Loi normale en dimension 2 


Définition 7.8 Le vecteur V = (X;Y) suit une loi normale centrée s’il a 
une densité f définie par : 


l | 
V(x;y) € R?, f(x; y) = er }9( 


où Q est une forme quadratique définie-positive sur R°, 
et à — e7 205%) Jrdy. On dit aussi que V est un vecteur normal, ou 


R2 
gaussien (centré). 


Remarque : la définie-positivité de Q permet d’avoir l’existence de l’inté- 
grale sur R° de f. 


Q étant une forme quadratique sur R°, elle s'écrit : 
a b x 
ae (2 05 2 )(5) 08 tom 


On rappelle que Q est définie-positive si et seulement si a > 0 et ac—b° > 0. 
On peut le voir en opérant une réduction de Gauss : 


ac — b? P 


b \2 
Q(x; y) = ax° + 2bxy + cy° = a(z + ) + 


est symétrique réelle, donc diagona- 


A1 0 
0 À 


a b 
b c 
lisable : elle est semblable à D — 


On peut aussi dire que À — 


) et Q est définie-positive si 
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et seulement si À, > 0 et À > 0. 
Or : 


A > 0 1 > O0 
À > 0 À + À > 0 
ac—b >0 
a+c>0 


” 
# 


Calcul de a : on a vu au chapitre précédent que : 


+00 —1 (z— e-m° 
+72 dt =0ovV2r 
— OO 


ce qui permet d’obtenir : 
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det À > 0 
tr A >0 

ac—b >0 
a > 0 


 — Î[ e—hala+by)? 16e b2 ,,2 
R2 
Lo En à b, 2 
2 FT erevrae 
— O9 — OO 


Var 27 fe —1 QE y? 


he a 


Va V ac 
27 


ac — b? 


dy 


Propriété 7.4 On a, avec les notations précédentes : 


E(X) = E(Y)=0 et Cov(X;Y) = 


—b 


c — b? 


Démonstration : on utilise aussi les calculs d’intégrales faits pour la loi 


normale (chapitre précédent) : 


ls 1 _1(æ-m}? 
T e 2 o2 dx 


o  OV2T 


+00 il 2 
_1(æ-m) 
et | x? e ? +7 d 


Le OV 2T 


(E(T) et E(T*) pour une v.a.r. T qui suit une loi W(m; o)). 
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Calcul de E(X) : 


E(X) 


EC 

R2 
1 ae 1 1 b ,,\2 

_ —ja(x+èy) —- 
sf (set dr )e 


1 Fe —b 1 ac—b? 2 
- frere 
Al. AT ° 


— (0 (imparité de la fonction à intégrer) 


Calcul de Cov(X; Y') : 


E(XY) = [l | _Tyf (x: y)dxdy 
1 . +00 


— = (| ve 2er) dr )ye-? 
À Jo — 00 


+00 _ 
_ = 27 (Ypo tv dy 


o Va 
D 
ri 
—b 
ac — b? 


(82 


Propriété 7.5 Les 
des lois normales. 


(92 


Fr) 


Démonstration : on calcule la densité de X et de Ÿ : 


+00 
Vy € R, fr (y) En 


— OO 


(82 


27 
1 


V27 


f(x; y)dx 


V AC — b2 V 2m 1 ac—b? y? 


(e 3 


(#1 


ac—b? _1ac-b?,9 
e 2 a y 


(92 


ac—b? 
a 


y? dy 


RTS b, 12 
— Era à e2&+av) dx 
—00 


149 


composantes X et Y du vecteur V = (X;Y) suivent 


Donc : Y + W(0; ay) avec oy = 4} s = F2” On obtient de la même façon : 
[8 — 


/ C 
X = N(0; ox) avec ox — TN 


wwWw.Ebook777.com 
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Propriété 7.6 Soit V = (X;Y) un vecteur normal. Alors on a l’équiva- 
lence : À et Y sont indépendantes si et seulement si Cov(X;Y) = 0. 


Démonstration : on a vu que l’indépendance entraîne la nullité de la 
covariance (c’est toujours vrai). 
Réciproquement : 


Cov(X;Y)=0 = b=0 
fx() = ——= ae 


_ 


> fx(e)fr(y) = ace 30 +) 
> Jx(z)fr(y) = f(x; y) 


Définition 7.9 Soit V = (X;Y) un vecteur normal. On appelle matrice 
de variances-covariances la matrice À : 


: V(X)  Cov(X;Y) 
— Cov(X;Y)  V(Y) | 


D'après les calculs qui viennent d’être faits, on a : 


1 C —b 
ou ac — b? —b à | 
On a donc Z = A1, d’où la propriété : 


Propriété 7.7 V = (X;Y) suit une loi normale si et seulement s'il admet 
une densité f qui s'écrit : 


1 —] TL 
V(x;y) € R° PURE y ÿ | 
DE 27 v det »; 


où » est la Matrice de variances-covariances de V. 


Par translation, on définit la loi normale générale (non nécessairement 
centrée) : 


Définition 7.10 Soit V = (X;Y) d'espérance m = (E(X); E(Y )). 
V suit une loi normale si et seulement si V — m suit une loi normale 
centrée. 
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La matrice de variances-covariances de V est la même que celle de V —-m 
et un changement de variables donne une densité de V : 


Propriété 7.8 Un vecteur aléatoire V d’espérance m — (m1; m2) et de 
matrice de variances-covariances X suit une loi normale si et seulement s1 
une densité de V est f définie par : 


Vu € R°, f(u) — 1 e72 ‘Cu-m)5 (um) 


27 y det » 


On a montré que les composantes X et Ÿ d’un vecteur normal sont indé- 
pendantes si et seulement si Cov(X; Y) = 0, ce qui revient à dire : 


Propriété 7.9 Soit V = (X;Y) un vecteur normal de matrice de va- 
riances-covariances X. Les v.a.r. X et Y sont indépendantes si et seule- 
ment si 2 est une matrice diagonale. 


VIL.9 - Loi normale en dimension ? 
On généralise ce qui vient d’être vu : 


ÀX1 
Définition 7.11 Le vecteur V = suit une loi normale (centrée) 
Xp 
s'il a une densité f qui s'écrit : 
1 
Via.) € RP, f(ti; To) = Der 29e) 


où Q est une forme quadratique définie-positive sur IR?, et 


a= [+ 20e)... de, 
RP 


À: 
Propriété 7.10 Soit V — , tel que les composantes X; possèdent 
X? 
un moment d'ordre 2. En notant 5 sa matrice de variances-covariances 
définie par : 


V5) ef--;rl, 5% = Cov(X:; X;) 


on a : V suit une loi normale (centrée) si et seulement s'il a une densité 
qui peut s'écrire : 


Vu € R?, f(u) = 
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De manière générale, V suit une loi normale si V — m suit une loi normale 
centrée (où m = (E(X1);---; E(X,))), ce qui équivaut à dire que V à une 
densité qui s’écrit : 


1 P 1 À t{u-m)2-l(u-m 
MER, = (Te) nn 


et on note alors : X = N(m; >). 


. . | 1 _1(x-m)? 
Remarque : si p = 1, on retrouve bien la fonction f(x) — e 2 Er | 
OV 2T 


puisque Z — (o*). Par cohérence avec la notation en dimension p, on note 
parfois N(m:; 0?) au lieu de W(m:; o). 


Les résultats démontrés dans le cas p — 2 se généralisent : si V suit une 
loi normale, alors ses composantes suivent une loi normale, et elles sont 
indépendantes si et seulement si Z est diagonale. 


VII.10 - Énoncé des exercices 


Exercice 7.1 Dans le carré unité, on choisit au hasard un point (X;Y), 
c’est-à-dire : 


VS C[0;1/?,P((X;Y) € S) = aire(S) 


1. Donner une densité de (X;Y). 
2. Déterminer les lois de X et Y. 
3. X et Y sont-elles indépendantes ? 


Exercice 7.2 Soit le polynôme P(X) = X° —2AX + B. On suppose que 
À et B sont des v.a.r. indépendantes qui suivent la loi uniforme sur [0; 1]. 


1. Quelle est la probabilité que P possède 2 racines réelles distinctes ? 
2. Quelle est la probabilité que P possède une racine double ? 


3. Quelle est la probabilité que P possède 2 racines complexes (et non 
réelles) ? 


Exercice 7.3 Soit (X;Y) de loi uniforme sur D(0; R), disque de centre 0 
et de rayon R (R > 0). 


1. Donner une densité de (X;Y). 
2. Déterminer les densités marginales de X et Y. 


3. À et Y sont-elles indépendantes ? 
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4. Calculer Cov(X;Y). 


5. SoitU = V X2 + Y2. Déterminer la fonction de répartition, une densité 
et l’espérance de U. 


Exercice 7.4 Soit f définie par : 


ae EH) gi 0O<x<y 


fG:y) = 0 sinon 


1. Déterminer a pour que f soit la densité d’un vecteur aléatoire V — 
(A; Y). 
2. Déterminer les densités marginales. 


3. Les composantes X et Y sont-elles indépendantes ? 


Exercice 7.5 Soient X et Y deux v.a.r. qui suivent une loi normale. 
1. Leur somme Z = X +Y suit-elle nécessairement une loi normale ? 
2. En supposant en plus Cov(X;Y) = 0, Z suit-elle une loi normale ? 


8. Le vecteur V = (X;Y) est-il nécessairement gaussien ? 


Exercice 7.6 Soient X et Y deux v.a.r. à densité. Le vecteur V = (X;Y) 
est-il nécessairement un vecteur à densité ? 


VILI.11 - Correction des exercices 
Exercice 7.1 
1. f est la densité uniforme sur la carré unité C = [0; 1f : 


_, 0 si (xy)écC 
fan = { si nec 


2. Loi de X : 


fe 1 


Même calcul pour fy. 


3. On a V(x;y) ER°, fx(x)fy(y) = f(x; y), et les variables X et Y sont 
donc indépendantes. 


Exercice 7.2 
Comme À et B sont indépendantes, le vecteur (4; B) a pour densité f — 


JaAÏB — L0:172. 
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1. P possède 2 racines réelles distinctes si et seulement si 47 — B > 0. Soit 
A; = {(a;b) € [0;1]*/a° — b > 0} : 


1 x? 1 
P(A4-B>0) = |. idady= | (| dy)dx = = 
A; o Jo 


2. On note A2 = {(a;b) € [0;1]?/a? — b = 0} et on obtient P(A° — B = 
0) = 0 (l'intégrale de f sur A2 est nulle). 


3. On passe à l’événement contraire : 
P(A-B<0)=1- P(4-B >0)=2 
Exercice 7.3 
1. (X;Y) suit la loi uniforme sur D(O; R) : 
0 si (x;y)# D(0;R 


) 
je) = | _ si (x;y) € D(0;R 


2. Densité de X : fx(x) = | f(x; y)dy, donc fx est nulle si x €] — R; R|, 
R 
et si x €] — R; R|: 


VER 2 
= —— dy = —VR? -— 1? 
fx(x) | F3 x R2 y 7 R? se 


Même calcul pour f;. 


3. X et Ÿ ne sont pas indépendantes puisque fx fy £ f. 
On peut aussi justifier la non indépendance en remarquant que : 


P(X> H)P(r> 2) #00 P(X > Zn > 2) =0 


4. Il est clair que E(X) = E(Y) = 0. On calcule E(XY) en passant en 
coordonnées polaires : 


1 1 R 27 
E(XY = || x pdd | { r* cos 0 sin OrdrdO = 0 
D(0;R) Te TRE Jo Jo 
Par conséquent Cov(X; Y) = 0. 


Remarque : on a donc un exemple de variables dont la covariance 
est nulle, et qui ne sont pas indépendantes. 
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5. Comme U est à valeurs dans [0; R|, si u < 0 alors P(U < u) = 0, et si 
u > R, P(U <u) = 1. Soit u € [0; À] : 


2 
Pu<u= f] lard = 7 


La fonction de répartition F' est donc : 


O0 si u < 0 
2 
F(u) = 7 Si 0<u<R 

1 si u>R 
On obtient une densité f en dérivant F Se en donnant une valeur 
arbitraire à f(R)). On peut choisir f:ur = he r](u), et on en déduit 
l'espérance : 

Qu 2 

E(U) = J'uf(odu = Tr du = À 


Exercice 7.4 
1. Soit T = {(x;y) € R°/0 < x < y} : 


a | | ee) rdy 
T 
+00 y 
—: à e “dx je *dy 
[ (x) 


+00 
= a | (1—e *)e Ydy 
0 


9 


| f(x; y)dxdy 
R? 


On pose donc : a = 2. 


2. Densité de X : fx(x) — | f(x; y)dy donc si x < 0, fx(x) = 0, et si 
R 


+00 
z > 0, fx(x) = | 2e *e Ydy = 2e *. 


Densité de Y : fy(y = | f(x; y)dx donc fy est nulle si y < 0, et si 


y 
y > 0, fy(y) = | 2e Ÿe Ydx = 2(1-e *)e Ÿ. 


0 
3. Les variables X et Ÿ ne sont pas indépendantes puisque fx fr # f. 


Exercice 7.5 
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1. Il suffit de prendre X de loi W(0; 1) et Y — —X pour constater que la 
réponse est négative. 


2. La réponse est non. Un contre-exemple classique est le suivant : on 
considère deux v.a.r. indépendantes X et T telles que X = W(0;1) et 


PORN ENE 


On pose ensuite Y = XT :Y m 0: " En effet, soit y € R : 


T' de loi discrète : 


P(Y <y) = P(XT<y) 
= Pre (XT < y)P(T = —1) 
+ P(r=1)(ÀAT < y)P(T = —-1) 
= SP(-X Su) + 5P(X < y 
PIX 2 y) + PX € y) 
= P(X<y) 


De plus, l'indépendance de X et T' entraîne celle de X° et T', donc : 
Cov(X;Y) = E(XY) = E(X?T) = E(X?)E(T) = 0 


Mais À + Ÿ ne suit pas une loi normale car si c'était le cas, on aurait 
P(X +Y = 0) = 0 (variable à densité). Or ici : 


P(X+Y =0) = P(X(1+T)=0) 

P((X = 0)U(T = —1)) 

= P(X =0)+P(T = -1)- P(X = 0)P(T = -1) 
1 


2 


3. Là aussi, la réponse est non : Soit V = (X;Y) de densité f définie par 
1 _1,, 
V(x;y) € R°, f(x; y) = 07° RCE HI aTY1L_1;1x(-1:1](T5 Y) 


où a est tel que f soit positive sur R°. 
Il est clair que V n’est pas gaussien. Or ses composantes le sont : 


1 1,2 1,2 1 1 1 
T) = t;y)dy = —e 2 | ed +] zydy = ——e 5° 
x(x) [x yhdy = [l v+ | sudy= 


donc X = W(0;1) (même résultat pour Ÿ). 


2 
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Exercice 7.6 
Soit (X; Y) de densité f. On note 6 la droite d’équation x + y = 0. 


P(Y =-X)=P(X+Y =0)— ][ finardy = 0 


On en déduit que le vecteur (X;—X) ne peut pas admettre de densité 
car si c'était le cas, on aurait P(—X = —X) = 0. Or on a évidemment 
P(-X =-X)=1. 


Chapitre VIII : Suites de variables aléatoires 


Les v.a.r. considérées sont soit discrètes, soit à densité. 


VIII.1 - Inégalité de Bienaymé-Tchebychev 


Théorème 8.1 Soit À une v.a.r. possédant une espérance m et une va- 
riance o°. Alors : 


ND 


Va > 0, P(IX — m| > a) < _ 


2 
Démonstration : elle repose sur le fait que pour un événement À, on a 
P(A) = E(14) (puisque la variable aléatoire 14 suit une loi de Bernoulli 
de paramètre P(A)). Soit À l'événement : À = {w/|X — m] > a}. 

Soient Y et Z les variables aléatoires définies par Y = |[X — ml] et Z = alu. 
On compare Y et Z : 

Si w € À, alors Y(w) = |X(w) — m|, donc Y(w) > a, et comme Z{(w) = a, 
on à : Y(w) > Z{(w). 

Si w & À, alors Z(w) — 0 et comme Y(w) est toujours positif : Y(w) > 
Z(w). D'ou finalement : 


Vu € (,Y(w) > Z(w) 
Par conséquent, Y? > Z?, et donc E(Y?) > E(Z?). Or E(Y?) = 0° et 
2 
E(Z?) = a? P(A), d’où P(4) < _ 


Remarque : l'inégalité a surtout un intérêt théorique (voir preuve de 
la loi faible des grands nombres), et elle est vraie pour toute variable ayant 
une espérance et une variance. 

Numériquement, la majoration est souvent médiocre. 

Par exemple, si X + W(m:; o), l'inégalité de Bienaymé-Tchebychev fournit 
la majoration : 


P(|X — m| > 20) < 


lt 


alors que : 
X -m 


P(IX—m| > 20) = P(IX*2 2) où X* = + N(0;1) 
— P(X*<-—2)+ P(X* > 2) 
— 2(1- P(X*<2)) 


0.0455 (lecture sur la table de la loi W(0;1)) 


lè 
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VIII.2 - Convergence en probabilité 


Définition 8.1 Soit (X,) une suite de v.a.r. et X une v.a.r. définies sur 
le même espace (91; 4; P). 
On dit que (X,) converge vers X en probabilité si : 


Va > 0, P(IXh — X| > a) ——=> 0 


n— +00 


La définition exprime donc que la probabilité d’avoir un écart entre X, et 
X supérieur à @ tend vers 0 quand n — +0. 

L’inégalité de Bienaymé-Tchebychev permet alors d'obtenir la loi faible 
des grands nombres : 


Théorème 8.2 Soit (X,) une suite de v.a.r. définies sur le même espace 
(Q; 4; P), indépendantes, et admettant la même Mer me et la même 


variance 0°. On définit leur moyenne Z, : Vn € N*,Z => X;. Alors : 


Zn ———> m en probabilité 


n—+00 


Démonstration : d’une part, 
1 1 | 
= E(- x.) _. 2, E(X5) = m 
et d'autre part, grâce à l'indépendance des Y; : 


V2) È x) - ES ve0- nt 


On applique l'inégalité de Bienaymé-Tchebychev à 7, : 


o? 
Va > 0,P(1Zr —- mm] > à) < 7% —— 0 
Q< n—+00 

Remarque : le théorème n’impose pas que les variables X,, aient la même 
loi, mais seulement qu’elles aient la même espérance et la même variance 
(et qu’elles soient indépendantes). 

La loi faible des grands nombres permet d’obtenir, dans le cas de variables 
de Bernoulli, le théorème de Bernoulli : 
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Théorème 8.3 On considère des variables de Bernoulli indépendantes, 
associées à la répétition de la même expérience aléatoire (pour laquelle on 
s'intéresse à un événement, appelé succès, noté S) : 
X. — 0 si aàlan“T* épreuve, on a S 
7 1 si à lan" épreuve, on a S 


En notant p = P(S), on a Vn E N°, X, = B(p), et : 


1 ñn 
— > X; —— p en probabilité 
n 1 n— +00 


1= 


Démonstration : on est dans les conditions du théorème de la loi faible 
des grands nombres. 


n 

SX; compte le nombre de succès obtenus au cours des n premières 
i=1 
épreuves. 
Le nombre moyen de succès obtenus au cours des n premières épreuves 
tend donc à se stabiliser autour de p, ce qui permet en pratique d’affecter 


la valeur p à P(S). 
VIIL.3 - Convergence en loi 


Définition 8.2 Soient (X,) une suite de v.a.r. et À une v.a.r., définies 
sur le même espace (Q; À; P). On note, pour tout n, F, la fonction de 
répartition de Xh, et F la fonction de répartition de X. On dit que (X,) 
converge en loi vers À si : 

Fhfz) —— F(x) 


n— +00 


en tout point de continuité de F. 


Remarque : la définition n’impose pas que l’écart entre X, et X tende vers 
0. Elle ne concerne que les lois de ces variables, exprimant la convergence 
simple de la suite de fonctions F, vers la fonction F (en tout point de 
continuité de F). 

Les deux modes de convergence ne sont pas équivalents. On a simplement : 


Propriété 8.1 


Xn ——> À en probabilité = Xy ———> X en loi 
n +00 n—+00 


et la réciproque est fausse. 
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On admet que la convergence en probabilité entraîne la convergence en 
loi. Pour voir que la réciproque est fausse, on peut considérer une variable 
X qui suit une loi W(0;1), et une suite de variables (X,) définie par : 
Vn, Xn = —X. Par symétrie de la densité de X, on a pour tout réel x, 
P(Xh < x) = P(X > —-x) = P(X < x), donc X, suit une loi W(0;1), 


et (Xh) converge en loi vers X. Cependant, il n’y a pas convergence en 
probabilité : soit e > 0. P(LXn — X| > €) — p(Ix| > =) > 0, donc 


P(|Xh — X| > €) ne tend pas vers 0 lorsque n — +oo. 


Théorème 8.4 Approximation de la loi hypergéométrique par la loi bino- 
miale. 

Soit (Xn) une suite de variables aléatoires telle que pour tout N > 1, 
Xn © H(N;in;p). Alors la suite (Xn) converge en loi vers une variable 
aléatoire X qui suit une loi binomiale B(n; p). 


L'interprétation est que, lorsque le nombre de boules est très important, 
la loi du nombre de succès avec des tirages sans remise tend vers la loi du 
nombre de succès avec des tirages avec remise. 


Démonstration : Xnw = N(N:n;p) si : 
1. Xn(Q) = [max(0; n — N(1 — p)); min(n; Np)|. 


Np\{NG-p) 
| k e | k | | 
Pour N assez grand, on a done Xy() = lc n]. Soit k € [0;n] : 
Cr Je) 
(%) 


= (N}, (NG = pl mn) 
 E(Np- EE)" (n=HUNG-p)-n+k)! N 
Are Le 

k J(Np—k)! (N(-p)-(n—k))! N! 


2. Vk € XN(Q), P(Xn = k) = 


g—+00 


} RCE (NP (NC p)} 


N? 


) pu - n-k 


ea mg”, donc: 


en ( 
= { 


S S 3 
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c’est-à-dire : Vk € [0;n], P(Xn = k) EN P(X = k), où X + B(n;p). 
On en déduit la convergence simple de la suite de fonctions FN vers F': si 
z < 0, alors Fn(x) = 0 = F(x), et six > n, Fn(x) = 1 = F(x). Pour un 
réel x de [0;n]\[0; n] : 


[x] [x] 
Fn(z) = D P(Xw =) => D P(X=k)=F(x) 
k=0 k=0 
([x] désigne la partie entière de x). La suite (X 1) converge donc en loi vers 
X. 


Théorème 8.5 Approzimation de la loi binomiale par la loi de Poisson. 
Soit (Xh) une suite de v.a.r. telle que Vn > 1,X, + B(r: *). À étant un 
n 


réel strictement positif fité. | 
Alors la suite (X,) converge en loi vers une variable aléatoire X qui suit 


une loi de Poisson P(À). 

La suite de variables binomiales B(n;p) doit donc être telle que np est 
constant (np = À). 

Dans la pratique, pour remplacer une loi binomiale par une loi de Poisson, 


on prend comme condition n > 30 et p assez faible (tel que np < 5). 


Démonstration : soit k € N. 


Vn > k, P(Xn =) 


] 
TS 
D 

S 
Co 
TS 
bi 

| 

S 

= 
1 
a" 


1 nl etr-#)h(1-à) 


kl(n — k)!n# 
LES Lo(n-H(-2+0(1) 
kl(n —k)!ln* 
—— À x 
n— +00 k! 
=  P(X=Kk) 


On montre ensuite que (F,) converge simplement vers F exactement de la 
même façon que précédemment. 


Le théorème qui suit explique l’importance de la loi de Gauss : 


164 Suites de variables aléatoires 


Théorème 8.6 Théorème central limite (TCL). 


Soit (Xh) une suîte de v.a.r. indépendantes et de même loi, admettant une 


espérance m et une variance 0°. 


Soit Sn = Ÿ x; {on a donc E(S,) = nm et V(S,) = no°). 


i=1 
Alors la variable S, centrée et réduite converge en loi vers une v.a.r. X 
qui suit une loi N'(0; 1), soit : 


Sn — nm | 2 
c _2 
Vr ER, P( no <a) —> | 7 dé 


Remarque : on n’a pas besoin de connaître la loi des X,. 


La démonstration du TCL est tout à fait hors programme. Elle s'appuie 
sur la notion de fonction caractéristique d’une variable aléatoire : 


. +00 . 
(u) = E(e-#* ) = | e"* f(x)dz 
Exemple 8.1 Soit (X;) une suite de variables de Bernoulli B(p), indépen- 
dantes. 


n 
La variable Sy = ÿ X; suit une loi binomiale B(n; p). 

i=1 

. / 2 1. : Sn — np - 
Alors la variable centrée réduite S, = ——— converge en loi vers X 
np(1 — p) 

qui suit une loi N(0; 1). 
La loi N(0;1) est donc une approximation de la loi binomiale centrée 
réduite. 
Dans la pratique, on prend comme condition n > 30 et np(1 — p) > 9 pour 
remplacer une loi binomiale centrée réduite par une loi normale N(0; 1). 
Ce résultat est connu sous le nom de théorème de De Moivre-Laplace. Il 
a été démontré en 1733 (sans le TCL et les fonctions caractéristiques !) 
par À. De Moivre. Cette preuve « historique > est très longue, et s'appuie 


notamment sur une approximation de n!. 


Remarque : S, étant discrète, S$° l’est aussi, et on a donc une suite de 
v.a.r. discrètes qui converge vers une v.a.r. continue. 


VIIL.4 - Convergence presque sûre 
Cette partie ne concerne que les candidats à l’Agrégation Interne. 


Définition 8.3 Soient une v.a.r. X et une suite (X,) de v.a.r. définies sur 
un même espace probabilisé ({; À; P). On dit que la suite (X,) converge 
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presque sûrement vers X si 


P(wen/ lim Xn(w) = X(w)}) = 1 


Exemple 8.2 Soit (X,) une suite de variables aléatoires définies sur le 
même espace (R; Br; P) par 


: 1 
= n Si WE [0 | 
O0 sinon 
On a Xh(0) = n — +oo, et siw £ 0, il existe un entier N tel que sin > N, 
alors w € 10; = | , donc Xn(w) — 0. Par conséquent, (X,) converge presque 


sûrement vers 0. 
Théorème 8.7 Loi forte des grands nombres. 
Soit (X,) une suite de v.a.r. indépendantes, de même loi, ayant une va- 
| 1€ 
riance finie, et d'espérance m. On pose pour tout n > 1, Zn = — SX. 
n 
i=1 


Alors la suite (Z,) converge presque sûrement vers m. 


Ce théorème est admis. 


VIIL.5 - Énoncé des exercices 


Exercice 8.1 On désire tester un dé afin de savoir s’il n’est éventuelle- 
ment pas pipé. 

Combien de lancers de ce dé doit-on effectuer pour pouvoir affirmer, avec 
un risque d'erreur inférieur à 5 %, que la fréquence d'apparition du 6 au 


cours de ces lancers diffère de 6 d'au plus 0.01 ? 
Exercice 8.2 Soient (X,) une suite de v.a.r. et X une v.a.r. telles que : 


X(Q) = {a;---;a} tVne N,X,(Q) = X(Q) 


Quel est le lien entre les deux propositions : 
à (Xn) converge en loi vers X. 
ii E(Xn) —— E(X). 
n—+00 
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Exercice 8.3 Démonstration à l’aide des probabilités du Théorème de 

Weierstrass-Stone. 

Il s’agit du théorème suivant : toute fonction continue sur [0,1] (plus 

généralement sur un compact |[a; b]) est limite uniforme d’une suite de po- 

lynômes. 

Autrement dit, il existe une suite (P,) d'éléments de R[X] telle que : 
ne Pr) — f(x) => 0 


On va démontrer que la suite de polynômes (P,) définie par : 


n 
LL] k = k 
Vn 2 1, PA(x) =) ( k E G- 2)" f() 
convient (ces polynômes sont appelés polynômes de Bernstein). On se place 
sur un espace probabilisé (; 4; P). Pour tout x € [0,1], on considère une 
suite de v.a.r. (X;) indépendantes et de même loi de Bernoulli de paramètre 
à 


1. Soit S, — Ÿ Xi. Quelle est la loi de S, ? 


i=1 


S. 
2. Montrer que E(f(=)) — P, (x). 
3. Comme f est continue sur le compact [0; 1], elle est uniformément conti- 
nue (Théorème de Heine, démonstration par l’absurde..) d’où : 


Ve>0,2a>0,[z—yl <a |f(x) — f(y)l <e 


On pose alors I = LÉ — r| < a}. Calculer P (Fe — r| > a) et 
n 


montrer que : 
IPa(x) — f(x) < e+2MP (È -2| > a) 


où M = sup {|f(x)|} 


xE(0;1| 
4. À l’aide de l'inégalité de Bienaymé-Tchebychev, majorer 


P( 


n 
— — rl > a) , et conclure. 
n 


Exercice 8.4 Inégalité de Markov. 
soit À une v.a.r. à valeurs positives, admettant une espérance. Montrer 
que : 
E(X 
VE > O0 P(X>t)< St 


Indication : s'inspirer de la preuve de l'inégalité de Bienaymé-Tchebychev. 
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Exercice 8.5 Soient (X;) une suite de variables indépendantes de même 
loi de Poisson P(1). 


1. Quelle est la loi de S, — 2x ? 
2. En utilisant le T.C.L., déterminer EU P(S% < 0), où SŸ est la va- 


riable centrée réduite associée à S, : S} = 
n n* 
3. En déduire un équivalent de ) FE 
k=0 


Exercice 8.6 Montrer que : 


20, fefa> rfi) 


VIII.6G - Correction des exercices 


Exercice 8.1 
On pose, pour i € [l;n] : 


x. = 1 si on obtient 6 au 2“ lancer 
° 0 sinon 


(L'univers est [1;6]”, on prend comme tribu A = P(Q), et on choisit pour 

P la probabilité produit, qui permet d’avoir l’indépendance des X;). Les 

v.a.r. X; suivent toutes une loi de Bernoulli B(p), où p est la probabilité 

d'obtenir un 6 lorsqu'on lance une fois le dé, et elles sont indépendantes. 
n 

La v.a.r. S x; compte le nombre de succès (nombre de fois où l’on à 
i=1 

obtenu 6), donc elle suit une loi binomiale B(n; p). Pour obtenir la fréquence 

d'apparition du 6, on pose naturellement : 


1 nr 
ad * 


On calcule son espérance et sa variance : 


p(1 — p) 
E(F t V(E, ) = av (| x) = (1 — — 
(Fr) =pe ) | np(l-p)=—— 
On suppose le dé non pipé et on soplique l'inégalité de Bienaymé-Tcheby- 
chev : 
P < > 0.01) < ——° 
— < 36n x 0.01? 
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5 | 
Il suffit donc que 36n x O0 < 0.05, soit n > 27778. 


Remarque : on peut aussi penser à utiliser le TCL qui permet d’ap- 
procher une loi binomiale par une loi normale : on a ici nf, = Bln;p), 


F. — 
Ten 7 Y'oùY << N (0; 1) (convergence au sens de la 
np(1 _— p) n— +00 
convergence en loi). D'où : 


P( 


et donc 


In, — ? \ 0.01/n 
VALES 3% 
0.01V36n 

V5 


F, - à 0.01) =  P 


= ”(re 


Il suffit donc (moyennant cette approximation) que n soit tel que 


p (ar . 2.01 Var 


————— | < 0.05. En utilisant la table de la loi normale, ceci 


Æ 
0.01V36n 
Ô 


implique ———— > 1.96, soit n > 5336. 


V5 


Exercice 8.2 . 


Onai ü: E(Xr) = D P(Xn = ax)ar. Or P(X4 = ax) —— P(X = 
1 n—+00 

dy). 

En effet, P(X, = @) = Ex) — F,(y), où x et y sont deux réels fixés 

tels que ag-1 < y < ax < TZ < ayy1 (ou y < on < x < a si k — 1 et 

Ap-1 < Y < An < T Si k = p), et par définition, la fonction F, converge 

simplement vers la fonction F'. 

En passant à la limite, on a bien : 


n—+00 


E(X») — D P(X = ax) —= E(X) 


La réciproque ti = 1 est fausse : 
il suffit de prendre les X, de même loi , et X telle que : 
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On a E(X,) = E(X) et (X,) ne converge pas en loi vers X. 


Exercice 8.3 
1. Sn r Bln; x). 


2. On a par définition de l’espérance : E(S,) = > k : ) ne (lire 


On applique le théorème de transfert : 


(A) = 210) )ra ar 


n . . n 1 2 
3. la variable Dr a pour univers image Ên (o) = { 0, —;—:...; 1}. Par con- 
n n nn 
séquent : 
P(fË-2a) = D P(-*) 
n TT n nn 
= >» P(Sa= 
kéI 
— Ÿ : | aS(1— x)" 
k&I 
En remarquant que f(x) = > f(x) ( : ) p“(1—p}""#, on a 


Be) fe = [E((Ë)-10) (4 Fan 


F6) 70) 
< EG) L f(x) : )#*0 pi 
DO OIE EEE 


LA 
M 
LT 
2" à 
Se 7 
"Es 
as" 
EE 
| 
S 
st 
1 
a" 


PA 

+ 

N 

= 

ge 
LS 
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S 


— , On à par l'inégalité de Bie- 
n 


4. Comme g(®) = x et v( ) _ = x) 


naymé-Tchebychev : 


P( 


#-:|>a) c z(1 — x) 


(L 


[A 


2M 
Conclusion : |P,(x) — f(x)| <e+ ——, et donc si n est assez grand : 


LPA(x) — f(&)| < 2e. : 


Exercice 8.4 

Soit À l'événement : À = {w/X{(w) > t}. 

On va utiliser, comme dans la preuve de l'inégalité de Bienaymé-Tcheby- 
chev, que P(A) = E(14). 

Soit Z = 114. Si w € À, Z(w) =t et X(w) > t, donc X(w) > Z(w). 

Si w € À, Z(w) = 0, et comme X est à valeurs positives, X(w) > Z(w). 
On en conclut que : Vw, X(w) > Z(w). Par conséquent, E(X) > E(Z), et 
comme E(Z) = tE(14) = tP(A), on a bien : E(X) > tP(A). 


Exercice 8.5 


1. Comme on l’a démontré au chapitre IV, S, + P(n). 


2. On a donc E(S,) = n et V(S,) = n. Le T.C.L. s'applique directement 
à la variable centrée réduite S, : 


n n k 
3. Comme P(SY < 0) = P(S, < n) — Ÿ_P(S = k) = er m. on ob- 
k=0 k=0 
tient squivalent : — nÀ l , 
ient un équivalent : D» Tr no 7€ 


k=0 


Exercice 8.6 
Le membre de droite fait bien sûr penser à la loi normale. Soient À + 
N(0; 1) et x un réel positif fixé. On a : 


| er dt = Var P(0 < X < x) 


(0 
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Par parité de la densité de la loi de X, P(0< X < x) — SP(- <XSeT) 


L’inégalité de Bienaymé-Tchebychev donne alors : 


1 
P(IX| > 2) < = 


> x 1 
D'où P(IXÏ£z)=1-P(XIZz)21-. 


Conclusion : 


Î <* L aux < x) > G- 


1 
2 


) 


Chapitre IX : Leçons d’oral (CAPES Externe) 


Ce chapitre ne concerne que les candidats au CAPES externe, les leçons 
de probabilité à l’Agrégation Interne étant différentes dans leur intitulé, 
leur contenu et leur esprit. 


Les leçons qui suivent ne sont pas des exposés type : elles sont souvent trop 
longues pour être présentées dans le temps imparti, car on a voulu donner 
toutes les preuves, même les plus élémentaires, et essayer de suggérer plu- 
sieurs illustrations. À chaque candidat de construire sa leçon suivant ses 
goûts et son niveau. 


On trouvera en particulier dans la plupart des leçons des commentaires, 
qui invitent à être attentif à des points particuliers, ou à cadrer l'exposé 
et permettre au candidat de se préparer à l’entretien avec le jury. 


Enfin, un complément est consacré à la leçon sur les séries statistiques 
doubles. 
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IX.1 - Utilisation d’arbres, de tableaux, de diagram- 
mes pour des exemples de dénombrement. Dénombre- 
ment des arrangements et des permutations. 

IX.1.1) Utilisation de diagrammes et de tableaux 

Utilisation de tableaux : on lance 2 fois un dé équilibré, dont les faces 
portent les numéros : 1, 1, 2, 2, 3 et 8. On fait la somme des deux numéros 
obtenus. Quelle est la somme que l’on a le plus de chance d’obtenir ? 


BAIE 
[3141516 


La somme égale à 4 est donc la plus probable. 


Utilisation de diagrammes : dans une classe, chaque élève étudie au moins 
une langue : latin, italien, anglais. 8 étudient les 3 langues, 8 étudient le 
latin et l’anglais, 5 le latin et l'italien, 5 l’anglais et l'italien, 20 l’anglais, 
13 le latin et 11 l'italien. Combien n’étudient que le latin ? Combien la 
classe comporte-t-elle d'élèves ? 


Latin Anglais 


CSL 


Italien 


Il y a donc 3 élèves qui n’étudient que le latin, et 29 élèves dans la classe. 
On utilise, pour construire le diagramme, la relation : Card(A U B) = 
Card À + Card B — Card(A NB), formule qui découle du « principe de la 
somme > : 


Théorème 9.1 Si À et B sont deux ensembles finis d’union disjointe, 
alors AU B est fini et : Card(A U B) = Card À + Card B. 


Démonstration : soient n — Card À et p = Card B. Il existe par définition 
deux applications 1 : À — {1;::-;5n} et p2 : B — {1;-..;:p} bijectives. 
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On construit une bijection de AU B vers {1;---;n+p} en faisant < glis- 
ser > la numérotation ®» : 
AUB - {1;...:n+p} 


® : P1(x) si zEA 
SOE n+@o(z) si zeB 
est bijective, et donc : Card(AU B) = n +p. 
IX.1.2) Utilisation d’arbres 


Exemple 9.1 Le code d’entrée d’un immeuble est composé d’un chiffre 
égal à 0 ou 1, puis d’une lettre choisie parmi { À; B; C; D}, puis d’un chiffre 
égal à 0 ou 1. Combien y a-t-il de codes possibles ? 

On raisonne sur l'arbre suivant : 


A B/ C\D A /B \C D 
0 /\ 
Un arbre est donc une succession d'étapes E1,:-:,E,. L'étape 1 consiste à 


choisir un élément parmi n1 éléments possibles. Ensuite, chaque étape Ex 
consiste à choisir un élément pour chacun des éléments choisis en Ey-_1 : on 
suppose que le nombre de possibilités est le même pour chacun des éléments 
choisis en Ex_1, et on le note nx. Alors, le nombre total de possibilités (de 
« branches de l'arbre >) est nin2:--n, : c’est le « principe du produit >. 
Le nombre de codes possibles est donc : 2 x 4 x 2 = 16. 


Mathématiquement, on se donne p ensembles finis A1,:::,A4, et on veut 
calculer le nombre d'éléments (a1;-:-;a,) € À1 X ::: x À,,. 


Définition 9.1 Un arbre est un produit cartésien d’ensembles finis À: x 
... X À, ; une branche est un p-uplet (a1;--:; a) € À X ::: x À, 


Le <« principe du produit > est donc le théorème suivant : 
Théorème 9.2 Si A:,...,A, sont des ensembles finis, alors À; x -:: x À, 


p 
est un ensemble fini et Card(A1 x ::: x À,) = El Card À;. 


i=1 
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Démonstration : on commence par montrer que si À et B sont deux 
ensembles finis, alors À x B est fini et Card(A x B) = Card À x Card B. 
On note n = Card À, p = Card B, et on procède par récurrence sur p. 

Si p = 1 : comme Card À — n, il existe une bijection @1 : À — {1;---;n}. 
L'application : 


f[AxB — {l-..;n} 
s: OR 


est une bijection, et donc : Card(A x B) = n. 

Hérédité : on note À = {a;---;a,} et B = {b;;-.-;b,11}. 

On décompose À x B en union de deux ensembles disjoints et on utilise 
l'hypothèse de récurrence : À x B = (A x {b:;,---;b,}) U(A x {b,H1}) et 
donc Card(A x B) = np +n = n(p +1). 

Le théorème est donc démontré pour deux ensembles. On étend ensuite le 
résultat à un nombre quelconque d’ensembles par récurrence. 


Définition 9.2 Soit p > 1. On appelle p-liste d’un ensemble À tout élé- 
ment (a;--:;a,) de 4, c’est-à-dire tout p-uplet d'éléments de À. 


Exemple 9.2 On jette 4 fois un dé à 6 faces : À = {1;---;6}, et(1;2;2;2) 
est une 4-liste de À. 


Propriété 9.1 Si À est fini, alors l’ensemble des p-listes d'éléments de À 
est fini et a pour cardinal (Card A}. 


Démonstration : on utilise le théorème sur le cardinal du produit carté- 
sien où l’on pose A1 = -:: = À, = À. 


Exemple 9.3 Pour les 4 lancers de dés, on a donc 6* résultats possibles. 


Propriété 9.2 Une p-liste d'éléments de À s’identifie à une application : 
{1;...;p} — À. 
Démonstration : l'application 


AP _ AU:-:P} 
F5 Gesa) 2 Lu dd 


? 7 


est bijective. On en déduit la propriété suivante : 


Propriété 9.3 Si À et B sont deux ensembles finis, alors le nombre d’ap- 
plications de B vers À est (Card A), 
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IX.1.3) Arrangements 


Définition 9.3 Soit À un ensemble non vide. On appelle arrangement de 
p éléments de À toute p-liste (a1;°::;a)) d'éléments de À deux à deux 
distincts. 


Comme tout arrangement est une p-liste, on a que, si À est fini, l’ensemble 
des arrangements est également fini. 


Notation : on note 4? l’ensemble des arrangements de p éléments d’un 
ensemble de cardinal n, et 4? = Card.4?. 


Théorème 9.3 


Démonstration : si p > n, c’est évident puisque les éléments doivent être 
deux à deux distincts. 

Si p < n : on procède par récurrence finie sur p. 

Si p = 1, À} = Card A = n. 


Hérédité : 
d: Ap+1 = AP x Ar, 
(15°; pi dp#1) + (ai-::54@p) X (apr) 
est bijective, et par conséquent : 
n! (n — p)! n! 


APti = 4 AL — = ————— 
" FTP (n-plin-p-1)! (n-(p+1)) 
Propriété 9.4 Tout arrangement de p éléments de À s’identifie à une 
injection de {1;---;p} vers À. 


Démonstration : on reprend la même idée que pour les p-listes. 


A, +  Inj({L::-}- À) 
4 {1;---;p} — À 


est une bijection. 
L'application f est bien injective car f(i) — f(j) = a = a; = i = j (puis- 
que &,°-- ,& sont deux à deux distincts). 
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Exemple 9.4 Le nombre de mots de 3 lettres distinctes (ayant un sens 
ou non...) est A5, = 26 x 25 x 24. 


Exemple 9.5 Le problème des anniversaires. On considère un groupe de 
n personnes et on veut déterminer la probabilité qu’au moins deux per- 
sonnes fêtent leur anniversaire en même temps. 

On suppose que toutes les années comportent 365 jours, et que les 365 
jours de naïssance possibles sont équiprobables.. (pour la modélisation pro- 
babiliste, on pose ( = [1;365]", 4 = P(Q) et P la probabilité uniforme). 
Soit À : « au moins deux personnes fêtent leur anniversaire en même 
temps >. 


Card A 1 — Aëcs 


PEER eo 6 


(& 0.5 pour n = 23...). 
IX.1.4) Permutations 


Définition 9.4 Soit À un ensemble de cardinal n. On appelle permutation 
tout arrangement des n éléments de À. 


De l’étude des arrangements, on déduit immédiatement que le nombre de 
permutations d’un ensemble À de cardinal n est n!, et que toute permuta- 
tion de À s’identifie à une bijection : {1;--:;:n} — À. 


Exemple 9.6 Nombre d’anagrammes de « admis > (5!), puis de <« admis- 


| 11! 
sibles > Ga ). 
Exemple 9.7 Dans le cas où À = {1;---;n}, on note S, l’ensemble des 
bijections de {1;---;n} dans lui-même. On a que (S,;0) est un groupe fini 


de cardinal n!. 


Commentaire : si on présente cet exemple, il faut avoir quelques idées 
sur les propriétés de (S,:0) : non commutativité si n > 3, engendrement 
par exemple par les transpositions, et savoir décrire ses éléments au moins 
pour n =2et n = 3... 


Exemple 9.8 L'ensemble des isométries qui conservent un triangle équi- 
latéral est isomorphe à S3 (on ramène le problème à la permutation des 3 
sommets, voir exposés de géométrie affine) et comporte donc 6 éléments : 
l'identité, 3 symétries axiales (qui correspondent aux 3 transpositions) et 
2 rotations (qui correspondent aux 2 3-cycles). 
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IX.2 - Coefficients binomiaux, dénombrement des com- 
binaïisons, formule du binôme. Applications. 


IX.2.1) Combinaisons 


Définition 9.5 Soit E un ensemble de cardinaln. On appelle combinaison 
de k éléments de E toute partie de E de cardinal k. 


Notation : on note : 


L ) le nombre de combinaisons de k éléments de 
FE, 


Théorème 9.4 Pour tout entier n, 
0 si k>n 
de ) — nl! 
k kl(n — k)! si k < 7 


Démonstration : si k > n, c’est évident. 
Si & < n, on procède par récurrence sur n : soit la propriété F, : 


Pour n = 0, on a bien : | — 1, la seule partie de l’ensemble vide étant 


l’ensemble vide. 
On montre ensuite que : Vn > 0,Pn = Par. 


Pour k = 0, il est clair que Le: ; AP 
Pour k > 1: soit E = {a;---;an+1} un ensemble de cardinal n + 1. 


L'ensemble des parties à & éléments de E s’écrit comme l’union disjointe de 
l’ensemble des parties à & éléments qui contiennent a,.,1 et de l’ensemble 
des parties à £ éléments qui ne contiennent pas ah+1. 

Soit À une partie (à k éléments) ne contenant pas a,41 : À est une partie 


de {a;---;a,} et on a donc À parties de ce type. 
Soit B une partie (à k éléments) contenant a,+1 : B = B’U {anr1} où B' 
est une partie de k — 1 éléments de {a:;---;a,}, et on a par conséquent 
n . 
k_] ) parties de ce type. 
n+l n n , : 
On a donc L | _ L | + k_1 ) et en utlisant l’hypothèse de 


wwWw.Ebook777.com 
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récurrence : 


n +1 n! n! 
k ) = En" G=Dm-Ek+I) 
nl(n+1—Kk)+nlk 
kl(n+1—k)! 
(n +1)! 
kl(n+1—k)! 


Propriété 9.5 Les coefficients binomiaux vérifient : 


smea(s)- (5) 


(SE) (En) 
* ()= (n°4) 
sk(r)=n(r2i) 


Démonstration : ces résultats s’obtiennent soit par le calcul direct (au- 
cune difficulté), soit par le dénombrement : 

1. C’est évident. 

2. Le résultat a été démontré précédemment (lors de la preuve de l’expres- 


sion de * p. 


3. On définit 9 : s _ Fe . ® est bijective, car 9 o d = Id (on 
dit que $ est une involution), et si on note P, l’ensemble des parties de E 
de cardinal 1, on a ®(Px) — Ph-K. Par conséquent Card P; — Card Ph_4. 

4. On dénombre les couples (a; À) où À est une partie de E de cardinal k, 


et a un élément de À. 


Si on fixe À, on a k éléments a possibles, d’où k ; ) couples. 


Si on fixe a, on a ( . | parties À possibles, d’où n LL. ) 


couples. 


La relation + ) = : | SE L d 1 | permet de construire ligne 


après ligne le triangle de Pascal qui donne les valeurs des . 
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DURE 
1 


[11/1/1010 


[2 11/2110 


[3 [1131817 


Exemple 9.9 Le nombre de tirages possibles au Loto est ( : | 
— 13983816. 


Exemple 9.10 Étant donnés deux entiers a et b, le nombre de façons 
d’aller de (0,0) à (a;b) en se déplaçant d’une unité vers le haut ou vers la 


droite à chaque fois est : : Ni | ): 
IX.2.2) Formule du binôme 
» . 2 1 PES — n kin—k 
Théorème 9.5 Soit n € N. V(a;b) € C*,(a + b)" = > ( L | a‘b"”. 
k=0 


Démonstration : on procède par récurrence sur n. Pour n = 0, c’est 
évident, et on montre l’hérédité en développant : 


(a+b}"Tt = (a+b)(a+b)" 


(a +b) ; | ) apr # 


k=0 


n 


>. s | ar+ipn-k Fe S> . ) arprti-k 
k=—0 


k=0 
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Après un changement d'indice dans la première somme : 


n+1 n 
aront = DC", jantes iQ n ) ans 
k=1 k=0 


DENT OILES CG) ne 
FE) (5) 


Remarque : la formule est vraie plus généralement dans un anneau com- 
mutatif. Si l'anneau n’est pas commutatif, elle est vraie pour deux éléments 
a et b qui commutent. 


Les résultats qui suivent sont une conséquence directe de la formule du 
binôme : 


Propriété 9.6 


: À (1) EE) 


k pairs,k=—0 k impairs,k=0 
_ n 
k = n27"t 
4 >|} 
k=0 


Démonstration : 


1. Développer (1 +1)”. 
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Remarque : le nombre de parties d’une ensemble ÆE de cardinal n 
est donc 2”, ce qui se montre directement avec la bijection : 


7 — {0;1}° 
À [ur à l4 


2. Développer (1 — 1)”. 


Remarque : de la même façon, on peut trouver la somme sur les k 


multiples de 3 de L ) en développant (1 + 5)". 


3. Séparer la somme précédente en distinguant k pair et k impair. 


4. Développer (1 + x)", puis dériver et évaluer en x = 1. 


IX.2.3) Applications 
— Formule de Vandermonde : 


D 
vospentm} (x )( M )=("") 
— p p 


Démonstration : soient Æ de cardinal n et F' de cardinal m deux en- 
sembles disjoints. Dénombrer les parties à p éléments de E U F. 


Remarque : on peut aussi chercher le coefficient de x? dans le dévelop- 
pement de (x + 1)"(x +1)7. 


En particulier, >\(( L ) — 7 ) 


k=0 
— Linéarisation de (cosx)", (sinx)" : 


Par exemple : 


e’T et? 3 
(cosx)® — ——— ) 


3 
1 ( 3 ) ikz —i(3—k)z 
= — € € 
8 \F 
1 
8 


Cas + 3e? + 3e? + et) 
— COS 3T + 3 COS Z 
_ 4 4 


Intérêt : par exemple, calculs de primitives. 
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—- Théorème de Fermat : 
Théorème. Soit p premier. Alors : 
Va EN, = ap] 


Démonstration : récurrence sur a. 
Si a = 0, le résultat est clair. Pour l’hérédité, on développe par la formule 


du binôme : 
p 
= ÿ P k 


k=—0 
Or, sikEeÏl;p — 1], p divise E ) En effet, k! L ) = p(p — 1)... 
(p — k +1) donc p divise k! à ) Comme p est premier avec tous les 


entiers de 1 à k, on a, par le théorème de Gauss, que p divise ( L ) 


Par conséquent : 


(a +1}? æ& + 1[p] 


a + 1[p] 


— Inégalité de Bernoulli : 
VneN,Vz >0,(1+x)" > 1+nx 


Démonstration : développer. 


- Calcul de S$,= D k°,a€N: 
k=1 
On peut obtenir les S,, de proche en proche grâce à la formule du binôme. 
On connaît : 


_ n(n +1 
=> x") 
k=—1 


(S+S1=(1+...+n)+(n+.-.+1) =n(n+1), puisqu'on a n fois le 
terme n + 1). 
Calcul de S» : 
(n+1) = n°+3n°+3n+1 
nm = (n—1)+3(n—1)*+3(n —1)+1 


23 1+3x1?+3x1+1 
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En additionnant ces n équations : 

(n+1} = 1+3S$+3Si+n 

n(n + 1) 
2 


Il reste à remplacer S: par pour obtenir : 
_ n(n+1)(2n +1) 


S2 6 


n°(n + 1)’ 


Pour S3, développer (n + 1)*--: (résultat : S3 — : je 
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IX.3 - Description mathématique d’une expérience a- 
léatoire : ensemble des événements élémentaires, évé- 
nements, probabilité (on se limitera au cas où l’en- 
semble des événements élémentaires est fini). 
Commentaire : il faut tirer toutes les conséquences du fait que {2 est 
supposé fini : 

on prendra toujours comme tribu P(Q) (il est donc inutile de parler de 
tribu) et on appellera événement toute partie de (2. 

Il n’y a aucun passage à la limite à évoquer : ÿ p; comporte un nombre 
fini de termes, et pour l’additivité, il n’y a pas d’union infinie puisqu'on 
n’a qu’un nombre fini d'événements. 


Il s’agit de décrire une expérience aléatoire, donc c’est vous qui choisis- 
sez pour chacun de vos exemples un {? cohérent et installez une probabilité 
P (justifiée par exemple par les indications de votre énoncé : dé équilibré..., 
ou par la loi faible des grands nombres...). 


IX.3.1) Expérience aléatoire, univers 


Définition 9.6 On appelle expérience aléatoire une expérience sur un 
système dont le résultat n’est pas connu d'avance et peut varier si on répète 
cette expérience. 


Exemple 9.11 Jeter une pièce de monnaie, lancer des dés, prélever des 
boules dans une urne... 


Le résultat, par hypothèse unique, de la réalisation de l'expérience aléatoire 
est noté w. 


Définition 9.7 On appelle univers l’ensemble des résultats possibles. Il 
est noté (1. 


Exemple 9.12 On effectue deux jets successifs d’un dé : ( = [1,6]. 


La difficulté vient du fait qu’il est possible, pour une même expérience 
aléatoire, de définir plusieurs univers, suivant ce que l’on entend par le 
terme < résultat possible >. Par exemple, pour une expérience aléatoire 
consistant à prélever une boule dans une urne contenant 2 boules rouges 
et 3 boules noires, on peut considérer qu’un résultat possible est l’une des 
5 boules (Q = {R1; Ro; Ni; No; N3}) ou une couleur (Q = {N; R}). 
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Notation : on note ( = {w:;-..;:w,} dans la suite. 
IX.3.2) Événements 


Définition 9.8 On appelle événement toute partie de (, et événement 
élémentaire tout singleton de (1. 


Exemple 9.13 On lance deux fois un dé à six faces. On pose A = [1;6]°. 
On considère À : < la somme obtenue est supérieure ou égale à 11 >. 

On a : A ={(5;6);(6;5);(6,6)} et À est un événement. 

On considère B : « la somme obtenue est divisible par 3 et par 4 >. 

On a : B={(6;6)} et B est un événement élémentaire. 


Commentaire : w, est un résultat possible (ou éventualité) et {w;} est 
un événement élémentaire. 


On utilise la correspondance suivante entre opérations sur les événements 
et langage ensembliste : 


Terminologie probabiliste | Terminologie ensembliste 


Evénement certain Ensemble entier 
Événement impossible Ensemble vide 
Événement élémentaire Singleton 
Événement contraire de À Complémentaire de À 
A ou B Réunion de À et B 

A et B Intersection de À et B 
À implique B À inclus dans B 
A et B incompatibles À et B disjoints 
w réalise À w appartient à À 


IX.3.3) Probabilité 


Définition 9.9 On appelle probabilité sur (Q; P(Q)) toute application P : 
P(Q) — R telle que : 


1. VAE P(Q), P(A) > 0 (positivité) 
2. P(Q) = 1 (totalité) 
3. VA et B disjoints, P(A U B) = P(A) + P(B) {(additivité) 


Commentaire : P est bien définie sur P(Q) et non sur (, et donc P(u;) 
n’a aucun sens : il faut être attentif à bien écrire P({w;}). 
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Propriété 9.7 Toute probabilité P vérifie : 
1. P(D) =0 

2. VA € P(Q), P(À) = 1 — P(A) 

3. AC B= P(A) < P(B) 

4. VA E P(Q), P(A) <1 


5. 91 A1,:--,AÀ4 sont 2 à 2 incompatibles, alors : 
k 
P(A: U +. U 4x) — Ÿ_P(A;) 
1—=1 


Démonstration : ces propriétés découlent immédiatement de la défini- 
tion : 


1. P(OUQ) = P(Q) + P(0) et UN =. 
2. Q = AU A = P(Q) = P(A) + P(À). 


3. B= AU(BNÀ) et l’union étant disjointe : 
P(B) = P(A) + P(BNA),et P(BNA) > 0. 


4 ACA= P(A) < P(Q). 


5. Immédiat par récurrence. 
Notation : on note, pour t € [l;n], p; = P({uw:}). 
Propriété 9.8 P est entièrement déterminée par la donnée de (p;);-1,.… n- 


Démonstration : par additivité de P, VA € P(Q), À £ 9, P(A) — > D. 
i/w;EA 


n 
Remarque : on a nécessairement Vi € [1;n],p; > 0 et Ÿ pi = 1. 

i=1 
Propriété 9.9 Réciproquement, étant donnés p1,--:,10, n réels positifs 
de somme 1, l'application P définie par : 


VAE P(N),AZ0,P(4A)= Ÿ met P())=0 


i/w;EA 
est une probabilité sur (Q; P(Q)). 


Démonstration : on vérifie les 3 axiomes. 
Positivité : (Vi € [l;n],p; > 0) = P(A) > 0. 
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Totalité : P(Q)= 9 p;=1. 


ÿ=1 
Additivité : Soient À et B d’intersection vide. 


P(AU B) = Y. Di — Ÿ mit + SO n=r À) + P(B) 


i/w;E AUB i/w;EA i/w;EB 


Propriété 9.10 Formule de Poincaré. Soient À; et A2 deux événements. 
Alors P(A: U À) —= P(Ai) + P(A>) — P(A: N A). 


Démonstration : 


A1 U A3 = AiU(A42N A) (union disjointe) 


=> P(A UA) = P(A;)+P(AN Ai) 
or: A = (41NA;1)U(4N A:) (union disjointe) 
— P(b) = P(A» M À) ax P(A: N À) 


d’où : P(A: U A2) —= P(A:) + P(b) — P(A: N À) 
IX.3.4) Cas particulier : la probabilité uniforme 


Définition 9.10 On appelle probabilité uniforme la probabilité P qui vé- 
rifie : 


P({ur}) == P({un}) 


Remarque : puisque la somme doit être égale à 1, on a évidemment : 
Vie [in], P({w;}) = - 


Propriété 9.11 Si P est la probabilité uniforme, alors : 


Card À 
Card (2 


Démonstration : on a bien P(ÿ) = 0 et si À Z Ü: 


P(A}= SP ({w; }) DE — = = Card À 


i/w;E A ET dl 


VA € P(A), P(A) = 


Commentaire : il n’y a pas que la probabilité uniforme sur P(Q). Ce 
sont des considérations relatives à l'expérience (boules indiscernables, dé 
équilibré) qui conduisent souvent à choisir P uniforme, mais on n’est pas 
toujours en situation d’équiprobabilité (voir exemple 9.15). 


IX.3.5) Exemples 
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Exemple 9.14 On tire simultanément 5 cartes parmi 32 au hasard. Quelle 
est la probabilité d’avoir 5 cœurs ? 
Soit E l’ensemble des 32 cartes. On pose comme univers : 


Q={M E P(E)/ Card M —5} 


On choisit pour P la probabilité uniforme, et on a, en notant C l’événement 
« on à obtenu 5 cœurs > : 


P(C) = CardC e 


_ CardfN ++ 
5 


Exemple 9.15 Une urne U; contient une boule rouge (notée R1) et une 
urne U, contient une boule rouge (notée R2) et une boule noire (notée N:) 
indiscernables au toucher. On choisit une urne au hasard, puis on prélève 
une boule dans l’urne choisie. Quelle est la probabilité d'obtenir une boule 
rouge ? 

Comme on a deux expériences aléatoires successives (choix d’une urne, 
puis choix d’une boule), l'univers va être un ensemble de couples. On pose 
ici : 


Q = {(Ui; R1); (U2; Ni); (Us; R2)} 


Choix de P : on note pi = P({(Ui; R1})}), ps = P({(U: N)}) et ps = 
P({(Uz; Ro) }). 

D'après l'énoncé : p1 = p2+p3 (la probabilité de choisir U est la même que 
celle de choisir U2) et p2 = p3 (boules « indiscernables au toucher > dans 
U). 


1 1 
De plus : p1 + Da + pa = 1, donc on obtient : p1 — 2 et Da = P3 = 2: 
Commentaire : P n’est donc pas uniforme ! 


On a alors, en notant R l'événement < on a obtenu une boule rouge > : 


P(R) = P({(U; 1)}U {(Uz: Ra)}) = pi + 5 = © 


Exemple 9.16 Problème posé à Pascal par le chevalier de Méré. 

« Qu'est ce qui est le plus probable : sortir au moins un 6 en lançant 4 fois 
un dé ou au moins un double 6 en lançant 24 fois deux dés ? > 

Premier cas : 4 lancers successifs d’un dé (équilibré). 
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On répète 4 fois la même expérience aléatoire et on pose donc A = [1;6]°. 
On prend comme probabilité P la probabilité uniforme. 
Soit À l'événement < le résultat obtenu comporte au moins un 6 >. 
On raisonne sur l'événement contraire : 
Card(À) 5‘ 


PIE Gard() — 6 


On a donc : : 


Poe . = 0.518 


Deuxième cas : 24 lancers successifs de deux dés (équilibrés). 

On répète 24 fois la même expérience aléatoire et on pose donc { — 
([1,6]*)*. On prend comme probabilité P la probabilité uniforme. 

Soit À l'événement <« le résultat obtenu comporte au moins un double 6 >. 
On raisonne encore sur l'événement contraire : 


Card(A) 35° 


Fe Card{() 362 
On a donc : 
3524 
P(A)=1- 3G4 œ (0.491 


Exemple 9.17 Problème posé à Galilée par le Duc de Toscane. 

« Pourquoi, quand on effectue trois lancers de dé, obtient-on plus souvent 
la somme 10 que la somme 9, bien que chacune soit obtenue de 6 manières 
différentes ? > 

On répète 3 fois la même expérience aléatoire et on pose donc A = [1,6]°. 
On prend comme probabilité P la probabilité uniforme. 

On note Sin <« la somme des 3 éléments du triplet vaut 10 > et So <« la 
somme des 3 éléments du triplet vaut 9 >. 

Sio est composé des éléments (1;3;6),(1;4;5),(2;3;5),(2;4;4),(2;6;2) et 
(3;,3;4), plus tous les triplets obtenus en permutant les éléments de ces 
6 triplets. Pour chacun des triplets (1;3;6),(1;4;5) et (2,3;5), on a 8! 
permutations, et pour chacun des triplets (2,4,4),(2;6;2) et (3;,3;4), on a 
3 permutations. 

Par conséquent : 


Card(S10) = 3 x (3!) +3 x 3 = 27 
En dénombrant les éléments de So de la même façon, on obtient : 
Card(So) = 3 x (31)+2x3+1—25 
On en conclut que P(So) < P(S0). 
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Exemple 9.18 Le problème des anniversaires. On considère un groupe de 
n personnes et on veut déterminer la probabilité qu’au moins deux per- 
sonnes fêtent leur anniversaire en même temps. On suppose que toutes les 
années comportent 305 jours, et que les 865 jours de naissance possibles 
sont équiprobables… 

On pose Q = [1;365]", et on choisit pour P la probabilité uniforme. 

Soit À : « au moins deux personnes fêtent leur anniversaire en même 
temps >. 


= Card À 2 
P(A)=1- = fn _ 1 _ 27365 
de) AURA Card 3657 


(= 0.5 pour n = 23...). 
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IX.4 - Probabilité conditionnelle ; indépendance de 2 
événements (on se limitera au cas où l’ensemble d’é- 
preuves est fini). Applications à des calculs de proba- 
bilité. 


Commentaire : on se place sur un espace probabilisé (Q; P(Q); P). 
IX.4.1) Probabilité conditionnelle 


Exemple 9.19 Soit une population de 100 individus : 40 hommes, dont 
10 sont malades et 60 femmes, dont 20 sont malades. On choisit une per- 
sonne au hasard. On pose donc ( = {wi;---;wi00} et on prend comme 
probabilité la probabilité uniforme. 

On suppose que l'individu choisi est une femme. Cet événement étant sup- 
posé réalisé, la probabilité que l'individu soit malade est alors : 


20 Card(M NF) 


20 __ 100 ____ CardQ __ P(MNF) 
60 60 Card F . P(F) 
100 Card { 


Ceci motive la définition suivante : 


Définition 9.11 Soit B un événement de probabilité non nulle. On ap- 
pelle probabilité conditionnelle à B, ou probabilité sachant B, associée à P 
l’application : 
P(Q) — R 

P(ANB) 
Ar PIE (B) 


P3 : 


Notation : on note aussi P(A/B) pour Pg(À). 


Commentaire : on sera alors attentif au fait que c’est une simple no- 
tation, et que AÀ/B n’est pas un événement. 
On utilise dans la suite indifféremment l’une de ces deux notations. 


Propriété 9.12 L'application PR est une probabilité sur (Q; P(Q)). 


Démonstration : on prouve que P8 vérifie les 3 axiomes : 
Positivité : P étant positive, PB l’est aussi. 


Totalité : P#(Q) = FR 1. 
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Additivité : si À; et À, sont disjoints : 


P((A1 U 4)nB) 

P(B) 
P((41NB)U(BN À2)) 
P(B) 
P(AnB)+P(AnB) 
P(B) 

—  Pp(A1) + P8(4) 


Pg(A: U À) 


Propriété 9.13 Soit B un événement de probabilité non nulle. Alors : 
VA € P(Q), P(ANB) = Pg(A)P(B) 
IX.4.2) Formule des probabilités totales et formule de Bayes 


Définition 9.12 On appelle système complet d'événements toute famille 
d'événements (A;);-1.… n telle que : 

1. Vie [i;n], À; # 0. 

2. Vij)eln]’,i£i= AnA,=0. 


3 (J4=R 
i=1 


Propriété 9.14 Soit (A;);-1.…n un système complet d'événements. Alors 
on a la formule des probabilités totales : 


VA € P(Q), P(A) = | P(A/A:)P(4:) 


(sous réserve que chaque À; ait une probabilité non nulle, afin que les 
probabilités conditionnelles soient bien définies). 


Démonstration : comme (4;);-1.… est un système complet, À s'écrit 
n 


A= AN (U4) et on a donc la décomposition de À sous forme d'union 
i=1 


disjointe : 
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Remarque : on écrit souvent la formule des probabilités totales relati- 
vement au système complet {A1; Ai} : 


P(A) = P(A/A;)P(A:) + P(A/A:)P(A:) 


Propriété 9.15 Soient À et B deux événements de probabilité non nulle. 
Alors on peut écrire : 


P(A/B)P(B) 


P(B/A)= EE 


(formule de Bayes) 
Démonstration : P(ANB) = P(A/B)P(B) et P(BNA) = P(B/A)P(A), 
puis P(AN B) = P(BN À). 


Cas particulier : lorsqu'on a un système complet (4;);-1.… ,, on obtient : 


P(A/A+)P(4+) 
P(A) 
P(A/Ax)P(A+) 
D 1 P(A/A:)P(A;) 


VkEel;n], P(A;/A) 


Dans le cas d’un système complet {A:; À: } : 


P(A/A:1)P(A:1) + P(A/A:)P(Ai) 

Exemple 9.20 On tire successivement et sans remise 2 boules d’une urne 
U composée de 2 boules noires et 8 boules rouges (indiscernables au tou- 
cher). 

Quelle est la probabilité que la 2°"* boule soit rouge ? 

Quelle est la probabilité que la 1°"° soit rouge sachant que la 2°" est noire ? 
On pose : = {(a;b) € U*/a £ b} et on choisit pour P la probabilité uni- 
forme. On note R; l'événement < la 1°" boule est rouge > et N,; « la i°"* 
boule est noire >. 

Par la formule des probabilités totales : 


H | 
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IX.4.3) Indépendance de deux événements 

On traduit le fait que la réalisation de B n’a pas < d'influence > sur celle 
de À, c’est-à-dire, dans le cas où P(B) £ 0 : Pg(A) = P(A). On a alors 
P(ANB) = P(A)P(B) et c’est ce que l’on peut prendre comme définition : 


Définition 9.13 Deux événements À et B sont indépendants si P(AN 
B) = P(A)P(B). 


Exemple 9.21 On jette un dé équilibré, expérience que l’on modélise en 
posant ( = [1,6], et en prenant pour P la probabilité uniforme. 

On considère les événements suivants : À = {2;4;6}, B = {5,6} et C = 
{5}. 

On a immédiatement : P(A) = 
1 
P(ANC) =0 et P(BNC) = S- 
On en conclut que À et B sont indépendants, mais que À et C ainsi que 
B et C ne le sont pas. 


1 


, P(C)= 3, P(ANB) =, 


OI 


Commentaire : ne pas confondre incompatibilité ((A N B) = () et 
indépendance (P(AN B) = P(A)P(B)). 

En particulier, on notera bien que la notion d'indépendance, à la différence 
de celle d’incompatibilité, dépend de la probabilité P : en toute rigueur, 
on devrait dire À et B sont P-indépendants. 


Propriété 9.16 


À et B indépendants = À et B indépendants 
& Aet B indépendants 
& Àet B indépendants 


Démonstration : si À et B sont indépendants, alors : 
P(ANB) = P(B)- P(ANB) = P(B) - P(A)P(B) = P(B)P(À) 


donc À et B sont indépendants. 
On en déduit de la même façon les autres implications. 


Remarque : la relation d'indépendance n’est pas < transitive >, comme 
on le voit sur l’exemple suivant : 


Exemple 9.22 On reprend l'exemple précédent et on considère l’événe- 
1 1 1 
ment D = {1;3;,5}. On a : P(A) — 5 P(B) = 3 P(D) = 5 P(ANB) — 
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a P(AND)= 0 et P(BN D) = 


Donc À et B sont indépendants, B et D sont indépendants, mais À et D 
ne sont pas indépendants. 


| 


IX.4.4) Applications 


Exercice 9.1 Événement indépendant de tous les autres. Montrer que À 
est indépendant de tous les événements B de P(Q) si et seulement si 
P(A) = 0 ou P(A) = 1. 

On suppose que : VB € P(Q), P(AN B) = P(A)P(B). 

Pour B = À, on a : P(A) = (P(A))°, d’où la condition nécessaire. 
Réciproquement : si P(A) = 0, alors : VB € P(Q),(AN B) C À, et donc 
P(ANB) = 0 = P(A)P(B), et À et B sont indépendants. Si P(A) = 1, 
alors P(À) = 0, et donc À et B sont indépendants, ce qui entraîne que A 
et B sont indépendants. 


Exercice 9.2 Fiabilité de test : on considère une population où une per- 
sonne sur 100 est malade. On dispose d’un test qui permet de détecter la 


maladie avec une probabilité de 10 et de reconnaître un sujet sain avec une 


Je 9 
probabilité de TS 


Quelle est la probabilité qu’une personne reconnue malade par le test le soit 
effectivement ? 
En notant les événements M : « la personne est malade >, et T : « le test 
annonce que la personne est malade >, on a : 

8 9 


P(T/M) = << et P(T/M) = = 


On applique la formule de Bayes : 


P(T/M)P(M) 


POI) = P(T/M)P(M) + P(T/M)P(M) 


8 1 1 99 


10 * 100 * 10 * 100 


Exercice 9.3 Un électron peut être chaque seconde dans deux états : À 
ou B. S'il est dans l’état À, la probabilité qu'il passe à l’état B la seconde 
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suivante est 0.6. S'il est dans l’état B, la probabilité qu'il reste dans l’état 
B la seconde suivante est 0.2. On suppose qu'il est dans l’état À à l'instant 
initial. 

Quelle est la probabilité qu'il y soit toujours dans deux minutes ? 

Soient les événements À, : « l’électron est dans l’état À à la n°" se- 
conde > et B, : « l’électron est dans l’état B à la n°°"® seconde >. 

On note an = P(A,), et on cherche donc a120. 

Par la formule des probabilités totales : 


Anti = P(Anr1/An)P(An) + P(An+1/Bn)P(B) 
0.4a, + 0.8(1 — a) 
— —(.4a, + 0.8 


On obtient donc une suite arithmético-géométrique, qu'il faut savoir trai- 
ter : 


4 4 
on cherche le point fixe : L = —O.4I + 0.8 = [ — 7 La suite (ar — =) est 
4 
géométrique de raison -0.4. Comme ao = 1, on obtient an = 7 (0.4) + 7° 


et en particulier 120. 


Commentaire : il s’agit de suites usuelles en probabilité, appelées « Chaï- 
nes de Markov >, en dimension 1 dans l'exercice proposé. 


Exercice 9.4 Formule d’Euler. 
Voir l'exercice 1.13 
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IX.5 - Variable aléatoire à valeurs réelles dont l’en- 
semble des valeurs est fini. Loi de probabilité. Espé- 
rance mathématique, variance. Exemples. 
Commentaire : on se place sur un espace probabilisé ({; P(Q); P). Com- 
me X(() est fini, la v.a.r. X admet des moments de tous ordres (pas de 
problème d'existence de l’espérance et de la variance). 

La tribu étant P(Q), on a nécessairement que : VB € Br, X”(B) € P(Q). 
Attention : le fait que X() soit fini n’implique pas que {? soit fini (prendre 
par exemple ( = R et X = 1ho:+o0[): 

IX.5.1) Variable aléatoire réelle 


Définition 9.14 On appelle variable aléatoire réelle toute application À : 
(2 — R. 


Exemple 9.23 On jette deux fois un dé équilibré, on pose = [1,6], et 
P la probabilité uniforme. 


X :w={(a;b)r a +b (somme des deux scores obtenus) 
O0 si a et b impairs 
Y':w={(a;b)r 4 1 si a et b pairs 
2 sinon 


X et Ÿ sont des variables aléatoires réelles. 


Propriété 9.17 L'ensemble des v.a.r. sur (Q; P(Q); P) a une structure 
d’algèbre pour les lois usuelles : la somme de deux v.a.r., une v.a.r. multi- 
pliée par un réel et le produit de deux v.a.r. sont encore des v.a.r. 


Démonstration : les applications obtenues sont bien des applications de 
(2 vers R. 


Notation : on note dans la suite X(Q) = {x1;-.-;x}. 
Exemple 9.24 On lance un dé équilibré, on pose ( = [1;6], et on prend 
pour P la probabilité uniforme. On réalise un gain nul si l’on obtient 1, un 


gain de 1 € si l’on obtient 2, 3 ou 4 et de 2 € s1 le résultat est 5 ou 6. On 
note X la v.a.r. égale au gain obtenu : X(Q) = {0;1;2}. 


wwWw.Ebook777.com 
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IX.5.2) Loi de probabilité 


Définition 9.15 La loi de probabilité de X est l’application : 


NELC R 
d À Fa P(X-{(A) 


Commentaire : on rappelle que par définition X (A) = {w e N/X(w) € 
A}. Pas question de < bijection réciproque >» ici... 


Notation : P(X7*(A)) sera souvent noté P(X € À). 


Théorème 9.6 P' est une probabilité sur l’espace probabilisable formé par 


le couple (X(Q);, P(X(Q))). 


Démonstration : P” est positive puisque P est positive. 
Totalité : P'(X(Q)) = P(X(X(Q))) = P(Q) = 1. 
Additivité : soient À et B deux parties disjointes de X (()) : 
P'(AUB) = P(X "(AU B)) = P(X'(A)UX "(B)) 
et comme X7'(A) et X7!(B) sont disjointes : 
P'(AUB) = P(X7(A)) + P(X7'(B)) = P'(A) + P'(B) 
En pratique, on se contente de donner les x; et les valeurs de P(X = x;), 


puisqu'on à : 


Propriété 9.18 La loi de probabilité P' est entièrement déterminée par 
ses valeurs sur les {t;};-1..n. 


Démonstration : comme P’ est additive, pour tout À € P(X(Q)), 


P(A)=P'| (J{x}]= 9 P(x})= à P(X=x) 


i/t;EA i/t;EA i/t:€EA 


Exemple 9.25 Une urne contient 3 boules rouges et 4 boules noires. On 
extrait successivement avec remise 2 boules de l’urne. 
On pose ( = {R1; Ro; Rs; Ni; No; Ns; NaŸ° et on prend P uniforme. On 
mise au départ 10 € et on gagne 8 € par boule rouge obtenue. Soit X la 
v.a.r. prenant pour valeur le gain final. X a pour loi : 


__X(Q) 10/72, 6 


16 [24/09 
P(X=x)| = |=|— 
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Propriété 9.19 Puisque P vérifie l’axiome de totalité, on a évidemment : 
n 
i=1 


Démonstration : il suffit d’écrire que les événements X7'({x;}),i = 
1---n, sont disjoints et que leur réunion est égale à (2. 


Commentaire : ne pas confondre la probabilité P, qui a été installée 
sur l’espace probabilisable ((; 4) et la probabilité P”, qui est la loi de X. 
Par exemple, pour le jeu avec mise initiale de 10 €, P est uniforme et P' 
ne l’est pas. 


IX.5.3) Espérance mathématique 


Il s’agit de la moyenne des valeurs de À pondérées par leur probabilité 
d'apparition : 


Définition 9.16 Soit X une v.a.r. discrète. On appelle espérance de X le 
réel, noté E(X) : 


n 


E(X)= 3 xP(X =) 


i=1 


E(X) est donc le barycentre de la famille de points pondérés (x;; P(X = 


me: 
Exemple 9.26 En reprenant le jeu des 10 €, 
16 24 9 22 


E(X) = (-1 — + (—2) x — —— 
(X) = (—10) x — +(-— )xX x 6%  . 
Commentaire : E(X) n’a aucune raison d’être égale à l’un des x; ! 


Propriété 9.20 On suppose les x; ordonnés : z1 < z2 < +: < Zn. 
Alors : 1 < E(X) < za. 


ne < n < Ts c’est-à-dire 1 < E(X) < xy. 


3—=1 1=1 


Démonstration : pOur tout ? € [1; n|, T1 < Li < Tn, Ce Qui entraine que 


Théorème 9.7 E est une forme linéaire sur l’espace vectoriel des v.a.r. 
définies sur (Q; P(Q); P) : si X et Y sont deux v.a.r., si À est un réel, 
alors : 


E(X + )1Y) = E(X)+XE(Y) 
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Démonstration : on note X(Q) = {x1;--.;7,} et Y(Q) = {y;---;Ym}. 
p 
Soit Z = X +Y. On note Z(Q) = {;-.-,2} : E(Z) = Ÿ_æP(Z = 2p). 
k=1 


Or on a : 
(i:3)/æi+y;=28 
d’où : 
p 
E(Z) = S mP(X=mNY =Yy;) 


k=1 (i:5)/xi+y;=28 


(5) 


= Sa Pate Tu Pan 
1 ji j=1 il 


= SJ mP(X=2)+ 3 y P(Y =y;) 
j=1 j=1 


= E(X)+E(Y) 


De plus, on a bien E(AX) — ÿ À; P(AX = Àx;) = AS mP(X 1). 
i=1 i=1 


IX.5.4) Variance et écart-type 


Définition 9.17 On appelle variance de X l’espérance de la variable (X — 
E(X)) : 


V(X) = E(X - E(X)) 
Théorème 9.8 


V(X) = Dai - EX) n 


On mesure la somme des carrés des écarts entre les valeurs de À et la 
moyenne, pondérés par les poids de probabilité. C’est donc un indicateur 
de « dispersion > autour de E(X). 


Démonstration : on note, pour tout 1, À; = {w/X{(w) = x;}, et on a 
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n 


la décomposition suivante : (X — E(X))° = d (z — E(X))*14,. En effet, 


i=1 
pour tout w € (1, les fonctions de droite et de gauche sont égales. 
On en déduit, grâce à la linéarité de l’espérance : 
E(X-E(x))) = D (&-E(X))E(14,) 
i=1 


D_(& — E(X)PP(X = xi) 


i=1 


Commentaire : les deux résultats précédents (linéarité de E et expression 
de V(X)) nécessitent une démonstration. Ils n’ont rien d’évident puisqu’en 
appliquant juste la définition de E, on a seulement : 


E(X +Y)=Ù (mi +y)P(X +Y = mi +y;) 
et : 
E((X -E(X))) = S[(xi - E(X))P((X - EG) = (mi - E(X))) 


Remarque : si ( % fini, ces PU sont immédiats, puisqu'on montre 
que dans ce cas E(X x X(w)P({w}). 


WE? 
Propriété 9.21 On a V(X) >0, 4 V(X)=0< X est constante. 
Démonstration : si V(X) = 0 alors Vi, (x; — E(X))*P(X = x;) = 0. On 
a donc que tous les x; sont égaux (à E(X)). 
Le calcul pratique de la variance se fait souvent avec la formule de Koenig- 


Huygens : 


Théorème 9.9 Formule de Koenig. 
= DaP(X = 2) - (EX)? 
i=1 


Démonstration : on développe : 


n 


D_(œi - E(X))p: 


i=1 


— Dé 2800 Dan + END n 
= D #Px = ti) — (E(X)) 


V(X) 
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Exemple 9.27 Pour le jeu des 10 €, on obtient : 


1 
V(X) = (10) x mt (2 x +6 x L 


Propriété 9.22 Soit (a;b) € R°. Alors V(aX + b) = a°V(X). 
Démonstration : il suffit d'utiliser la linéarité de E : 

V(aX + b) = E(a?(X — E(X))°) = a E(X — E(X)}° = a V(X) 
Définition 9.18 On appelle écart-type de X le réel o(X) = /V(X). 
IX.5.5) Exemples 


Exemple 9.28 Soit X de loi uniforme sur [1;n]. Vérifier que : 


n+l n°? — 1 
E(X) =" et V(X) = 


Exemple 9.29 Une urne est composée de 4 boules (indiscernables au tou- 
cher) portant les numéros suivants : 0, 1, 1 et 2. On tire une poignée de 
n boules et on appelle X, le produit des numéros obtenus. 

Déterminer la loi de chaque variable X;. Combien vaut-il mieux tirer de 
boules ? 

Soient E = {0;:1;1;2} et n € [1;4]. Pour modéliser l'expérience, on 
pose comme univers (,, = {A C P(E)/ Card À = n} et, les poignées étant 
équiprobables (pour n fixé), on choisit pour probabilité P, la probabilité 
uniforme. Le calcul des poids de probabilité se réduit à du dénombrement 


puisque P, est uniforme : Card 7, — ‘ , et on obtient : 


On compare les espérances : E(X:) = 1, E(X2) — 2 E(X3) = à: 


et E(X4) = 0. Il vaut donc mieux prélever une seule boule. 
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Commentaire : pour cette leçon, il peut être très enrichissant de garder 
à l’esprit la loi faible des grands nombres qui peut permettre de justi- 
fier certains choix de probabilités (voir chapitre VIII). Elle donne aussi 
une interprétation de l’espérance : la moyenne des valeurs prises par X, 
lorsque l’on répète l’expérience aléatoire, tend vers E(X). Surtout, ne pas 
interpréter l'espérance comme la valeur la plus probable de X : il est clair 


. Ÿ 
que la variable X, du dernier exemple ne vaudra jamais 5 
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IX.6 - Schéma de Bernoulli et loi binomiale. Exemples. 
IX.6.1) Loi de Bernoulli 


Définition 9.19 Soit p € [0;1]. X suit la loi de Bernoulli de paramètre p 
S1 : 


1. X(Q) = {0;1} 
2. P(X =0)=1-pet P(X =1)=9p 
On note alors : X + B(p). 


Contexte usuel : on considère un espace probabilisé ((; 4; P) et on s’inté- 
resse à un événement S, appelé « succès >. 
On définit alors une v.a.r. 


X:wr ù "+ es 

0 sinon 
X est donc simplement l’indicatrice du succès S et si on note p = P(S), 
X suit une loi de Bernoulli de paramètre p. 


Propriété 9.23 E(X) = p et V(X) = p(1 — p) 
Remarque : les calculs des moments de X sont facilités par le fait que : 


Vn >1,X"=X 


IX.6.2) Schéma de Bernoulli 


On considère une expérience aléatoire ayant 2 issues : succès S ou échec S. 
Une expérience aléatoire ainsi modélisée est appelée épreuve de Bernoulli : 
on a posé ( = {S; S}, et, si on note p la probabilité du succès, on définit 


une probabilité P, par P.(S) = p (et donc P.(S)) = 1 — p). 


Définition 9.20 On appelle schéma de Bernoulli une suite finie de répé- 
titions indépendantes d’une même épreuve de Bernoulli. 


Soit n le nombre de répétitions de l’épreuve de Bernoulli. Le schéma de 
Bernoulli a pour univers : (, = {S; S}*. On définit ensuite une probabilité 
P, sur P(Q,) : comme (, est fini, il suffit de définir PF, sur les singletons 
(événements élémentaires). 

Soit (a1;:-:;,a,) € {S; S}°. On pose : 


P(a;---;an)}) = P({a})--: Pi({an}) 
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Soit k = Card{a;/a; = S}. Alors : 


PA({(o1;::;an)}) = p*(1 — p} A 


Commentaire : la probabilité P, s'appelle la probabilité produit, et choi- 
sir cette probabilité permet de traduire que les répétitions de l’épreuve de 


Bernoulli se font de manière « indépendantes >, au sens suivant : soit S; 


l'événement <« on a obtenu un succès au cours de la °°7€ épreuve >. 


PA(Si) = Pa: am) EN x... xXAOxS x... x 0) 

= P(Q):..P(0)P(S)P(Q):-.P1(Q) 
= D 

Sii £ J: 

AC A S;) P na ((@1; An) ex: 

DS XX SK. K 0) 

(où les 2 S apparaissent en position t et 3) 

= P(Q)...RA(9)P(S)P(Q)-..P(Q)P(S)P1(Q) +++ PQ) 

p° 

= P(Si)P(s;) 


Donc $; et S; sont indépendants. P, s'appelle la probabilité produit. 


On définit ensuite, pour à € [1;n] : 
(9 — {0;1} 


ia) à {0 si m=S 
1 si a —=S 


X; : 


On a donc des variables de Bernoulli : 
Vie {i1;n], X;  B(») 
Théorème 9.10 Les v.a.r. X; sont 2 à 2 indépendantes. 


Démonstration : « X, = 1 > est l'événement S; et « X; = 0 > est l’évé- 
nement S;, et on a vu que S; et S; sont indépendants. Par conséquent : 


P(Xi=1NnX;=1) = PASNS,) = PS) Pa(s;) 
Pa(Xi = 1)Pa(X; = 1) 


De plus, l'indépendance de $; et $; entraîne celle de 5; et de S;, celle de S; 
et S; ainsi que celle de S; et S;, ce qui permet d’effectuer immédiatement 
les trois autres vérifications. 
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IX.6.3) Loi binomiale 


C’est la loi du nombre de succès obtenus au cours du schéma de Bernoulli, 
et on pose donc naturellement : 


Définition 9.21 On dit que Z, suît la loi binomiale B(n; p) si 


Zn = > x 


où les X; suivent toutes la même loi B(p) et sont 2 à 2 indépendantes. 


Propriété 9.24 On a Z,(Q,) = [0;n], et : 
Vk E [;n], P(Z, = k) = ( : )#*0 — p}r À 
Démonstration : soit k € [0; n] : 


P(Za = k) = P(S X; = k) 


n 
L'événement 3 X, = k est l’union disjointe des événements élémentaires 
i=1 
{(a1;-::;a)} où k éléments a; sont égaux à 1 et n — k éléments a; sont 
égaux à 0. 
Chacun de ces événements élémentaires a donc pour probabilité : 


Ph({(a;";an)}) Pi({ai}):::Pi({an)}) 


= pAi-p}* 


Lé Lé 1 / L TD \ ° 
et ces événements élémentaires sont au nombre de L ) d’où par addi- 


tivité de P, : 
= _ n k n—k 
Ps = 1) = (4) D 


Exemple 9.30 On lance 10 fois un dé équilibré. 

Quelle est la probabilité d'obtenir pour 4 lancers un résultat supérieur ou 
égal à 5 ? 

L'épreuve de Bernoulli est ici : lancer un dé équilibré, on appelle ue 


l'événement S : < le résultat est supérieur ou égal à 5 >, on a p = 3 
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Le schéma de Bernoulli est de répéter n = 10 fois l’épreuve de Bernoulli. 


Commentaire : la répéter de manière < indépendante > signifie que l’on 
munit l’espace probabilisable ({10; P(Q10)), où No = £{S; SY de la proba- 
bilité produit Po. 


On a donc : 


1 10 1\4/2\6 
Z + B(10;2) PA = 0e () (2) = 0.23 
Combien de fois faut-il lancer le dé pour que la probabilité d’avoir au moins 
un succès soit supérieure ou égale à 0.95 ? 
Pa(Zn > 1) 0.95 
= 1— P,(Zn = 0) 0.95 
0.05 
In 0.05 
2 


IV IV 


ÿ 
2. 
CO | ND 
nt 

3 

l'A 


7.39 


In — 
"3 
Donc il faut au moins 8 lancers. 
Propriété 9.25 Si Z,  B(n;p), alors : 
E(Zn) = np et V(Zh) np(1 M p) 


Démonstration : on utilise la linéarité de l’espérance : 


L B(5 Xi) — D Ex) = np 


et on développe la variance : 


=v(Dx) = vu )+2Ÿ 7 Cov(X:; X;) 


1<7 


Comme les X; sont indépendantes, les covariances sont nulles et donc : 


= Xrt- — p) = np(1-p) 
Exemple 9.31 En reprenant l’exemple précédent, E(Z10) = — 


1 , 
Remarque : pour n fixé, la variance est maximale pour p = -—, ce qui 


est cohérent puisque cela correspond à l’équiprobabilité entre le succès et 
l’échec. 
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IX.7 - Séries statistiques à deux variables numériques. 
Nuage de points associé. A justement affine par la mé- 
thode des moindres carrés. Droites de régression. Ap- 
plications. L’exposé pourra être illustré par un ou des 
exemples faisant appel à l’utilisation d’une calcula- 
trice. 

IX.7.1) Série statistique à deux variables numériques 

On considère une population ( d'individus &1,:-: ,«w,. 

On définit sur cette population deux caractères numériques, c’est-à-dire 
deux applications : 


(Q — R Q — KR 
x:{ù > X(w;) avi{E [mur 4 Y (w;) 


On note X{(w,) = x; et Y(w;) = y. 


Exemple 9.32 {2 est l’ensemble des candidats ayant composé aux deux 
épreuves, À associe à chaque candidat sa note à la première épreuve et Y 
sa note à la deuxième. 


Le but est de déterminer s’il existe une « relation > entre X et Y. 

On considère donc les couples (x;; Y%);-1..n. Comme ils ne sont pas nécessai- 
rement distincts, on regroupe les couples identiques en leur affectant un 
poids »p; égal à la fréquence d’apparition du couple : 


Définition 9.22 On appelle série statistique double la donnée de N cou- 
ples pondérés ((x;; y); D:):-1..n, où les p; sont des réels strictement positifs 
de somme égale à 1. 


Exemple 9.33 On considère 5 candidats, qui ont obtenu les notes sui- 
vantes : 


ETEUEIEUEE 
PAREIL 


LE 2: Li 
0:55 1011176 
Dans un repère orthonormé (O: j: 7), on place les points M(t:; y) et entre 


parenthèses leur poids p; : on obtient un nuage de points pondérés. 
Paramètres de la série 


N 
moyennes : X — D» Dit et Y — Ÿ DiYi. 


i=1 41 
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Variances : V(X) = D pi(zi — X)° et V(Y) = DEC — 


1=1 
Covariance : Cov(X;Y) Sn pi(x à — Ÿ). 


On vérifie facilement en développant que : 


= ÿ 4 TÉ Di — (idem pour Ÿ) 


Cov(X;Y) D DitiYi — (X XY) 


Définition 9.23 Le point G(X;,Y) est appelé point moyen du nuage. 


C’est donc le barycentre du système de points pondérés (M; p;). 


IX.7.2) Ajustement affine et droites de régression 


On souhaite déterminer la « meilleure > droite À passant par le nuage de 
points. 

On suppose dans la suite que X n’est pas constante (sinon, le nuage est 
formé de points alignés verticalement) ainsi que Ÿ (le nuage étant alors 
horizontal). Pour donner un sens au terme < meilleure > droite, il faut se 
donner un critère : on cherche la droite qui minimise : 


N 
Ÿ_piM;H? 
i=1 


où H; est le projeté de M, sur À parallèlement à l’axe [Oy). On veut donc 
minimiser la fonction 


N 


b(a;b) = D pui — (ax; + b))? 


1=1 


Méthode : on met @ sous forme canonique par rapport à b, puis par rapport 
à à. 
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N N 
p(a;b) = Ÿ nb? — 2b Ÿ  pi(yi — ati) + D nt — ax) 
i=1 i=1 
= b- 2b(Y — aX) + Spa + d S pur? — 24 So 
i=1 = = 
EL A N N 
= (6-(F-aX)) -(F-aX) +5 py+a pr 


N 
—2a > DitiV 
i=1 
N 


= (b—-(Y -aX)}) —Y" - à X° +2aX XV +9 ny} 


j=1 
N N 
+0? D piti — 2a d pit 
i=1 j=1 
= (b—-(Y-aX)) +V(Y)+ a V(X) — 2aCov(X;Y) 


Cov EN) _ Cov (X:Y} 


— b-(F-aX)) +V(X)(a- V(X) V(X) 


+V(Y) 
o est minimale lorsque les deux carrés sont nuls, d’où le théorème : 


Théorème 9.11 J{ existe une unique droite À : y = ax + b qui minimise 


N 
Ÿ piM;H?. Elle a pour coefficients : 
i=1 
_ Cov(X;Y) 
__. V(X) 
b — ŸY -aX 


Remarque : À passe par le point moyen G(X; Y} (ce qui n’était pas im- 
posé au départ). 


Le minimum de @ vaut : 


Cov(X;Y} 
v@) (1 _ V(X)V() ) 
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Définition 9.24 On appelle coefficient de corrélation linéaire : 


_ Cov(X;Y) 
_ a(X)o(Y) 


Propriété 9.26 —1 < r < 1 et |r| = 1 si et seulement si les points sont 
alignés. 


Démonstration : le minimum de @ vaut V(Y)(1 — r*). d étant positive, 
son minimum l’est aussi, et donc r? < 1. De plus, r°? = 1 si et seule- 
ment si le minimum de @ est nul, auquel cas les points sont tous sur A 
(Vi, y; — (at; + b) = 0). 


Remarque : la démonstration peut se faire aussi en invoquant l'inégalité 
de Cauchy-Schwarz (développer Cov (X + AY; X + AY )), et son cas d’éga- 
lité. 


Le coefficient r mesure donc la <« qualité > de la droite À obtenue : plus 
Ir| est proche de 1, plus l’ajustement est bon. On fixe souvent la barre à 
0.7 (voir l'interprétation en termes d’angle dans la partie consacrée à des 
compléments sur cette leçon). 


Définition 9.25 À est appelée droite de régression de Y en À. 


Avec les données numériques de l’exemple, on obtient À : y = 0.54x + 3.07, 
et r = 0.81. 


Définition 9.26 Si on échange les rôles de X et Y, on obtient la droite 
de régression de X en Y : A':x= a"y+b", où 


Cov(X;Y) 
— 
V(Y) 
b = X-aY 


Le coefficient de corrélation est toujours : 


. Cov(X;Y) 
_ a(X)o(Ÿ) 


(expression symétrique en X,Y) 
Propriété 9.27 0 < aa’ < 1 et : 


aa =1<4 les points sont alignés & À = A 
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. V2 
Démonstration : aa — a TE — y? 


IX.7.3) Applications 


Si la relation affine entre X et Y est « insuffisante > ([r| trop faible), on 
peut envisager d’autres relations fonctionnelles : 

ajustement par une fonction puissance : y = ax. On a alors Iny — 
bin x + Ina, et on cherche un ajustement affine entre In X et In Y. 
Ajustement par une fonction exponentielle : y = ae”°. On any = br+Ina, 
et on cherche un ajustement affine entre X et In Ÿ. 


Dans le cadre des séries chronologiques (où l’une des deux variables est 
le temps), cela permet d’obtenir une courbe de tendance, premier pas en 
vue de faire de la prévision. 


Compléments sur les statistiques doubles. 215 


IX.8 - Compléments sur les statistiques doubles. 

Le but est de donner un éclairage sur cette leçon, grâce à l’algèbre bi- 

linéaire. 

On considère une population pondérée finie (w;; p;);-1.. telle que pour tout 
n 

i, p; El0; 1{, et d. D; = 1. On définit deux caractères numériques sur cette 


i=1 
population : 


x fi — R +y:{ 5 = KR 
Wj 3 TT Wj 7 


On peut les représenter dans R°, en se donnant un repère orthonormé et 
on à alors un nuage de n points pondérés M;(x;; y;). On travaille avec la 
norme euclidienne, et le but est de trouver la droite À qui minimise : 


Sp.M;P° 
1 


où P, est le projeté de M; sur la droite À parallèlement à l’axe [oy). 
Si on note y = ax + b l'équation de À, on veut donc déterminer : 


Î { 2\ 92 2 b d 
Ée >. (gi — ax — b) 
C’est le point de vue à PR dans la leçon. 


On peut aussi travailler dans R‘, ensemble des applications de ( dans 
R. À et Ÿ sont alors représentées par : 


et 


et on identifie R° et R°. On définit l’application 9 sur (R"}? par : 


POX;Y) = D Dita 
il 
= E(XY) 


C’est clairement une forme bilinéaire symétrique définie-positive (car pour 
tout 4, p; > 0), c’est-à-dire un produit scalaire. Le problème de minimisa- 
tion s'écrit alors : 


inf {tu - ax 1} = inf {E((Y —-aX —b))} 


(a;b)ER? (a; b)EeR? 
ZEV ect: D. (( k )} 
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On suppose X non constante, de sorte que (1; X) est une famille libre de 
R°. 
Comme (R°; ®) est un espace euclidien, l’inf recherché est un min, atteint 
pour Z = Ÿ, projeté orthogonal de Y sur F = Vect(1; X). On peut l’obte- 
nir en orthonormalisant la base (1; X) ou en caractérisant directement Y 
par : 
Ye Vect(1; X) 
Y-Y Li 
Y-Y IX 
On a donc : 
4(a;b) € R°?,Ÿ = aX +b 
E((Y —Y)1) = 0 
E((Y —Y)X) =0 
(a; b) € R°,Ÿ = aX + 
& E(Y)=E(T) 
E(YX) = E(YX) 
La deuxième équation donne : 
E(Y) = E(aX + b) 
= E(Y)=aE(X) +b 
= b=E(Y)-aE(X) 
On remarque donc que À passe par le barycentre G(E(X); E(Y )). 
On reporte la valeur de b dans la troisième équation . 


E(aX° +bX) = E(XY) 
=> aE(X°) +bE(X) = E(XY) 
= aE(X?) + E(Y)E(X) - aE(X}° = E(XY) 
Cov(X;Y) 
_ _vn 
On en déduit la valeur du min, c’est-à-dire la distance de Y à Vect(1; X) 
(au sens de @!) : 


EF) 


— 


E(Y?) — E(Ÿ?) (Théorème de Pythagore) 
— E(Y?) — E(a°X°? + b° + 2abX) 
= E(Y*) - E(X?) - E(YŸ - & E(X)° 
+2aE(X)E(Y) — 2aE(X)E(Y) + 2a°E(X) 
(Y) — + Go 
Cov(X;Y }? 
a 018 21262 ") 


] Ï 
S 
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Cov(X;Y) 
o(X)o(Y) 
tant X* = X — E(X) et Y* = Y — E(Y) les variables X et Ÿ centrées 
réduites, on a : 


Interprétation du coefficient de corrélation linéaire r — , En no- 


Cov(X;Y) = E(X — E(X))(Y — E(Y)) = #(X";Y*) 
et V(X) = E((X — E(X))°) = b(X*; X*), d'où : 


p(X*; Y*) 


. POX*; X*)/D(Y*; Y*) 


C’est donc le produit scalaire des vecteurs X”* et Y”* divisé par le produit 
des normes. Comme on est dans un espace euclidien, c’est donc le cosinus 
de l’angle formé par ces deux vecteurs : 


r = cos(X*; Y*) 


Lorsqu'on donne comme borne r > 0.707, on considère donc que l’on a un 


bon ajustement si l’angle formé par (X*; Y*) est inférieur à + 
Cet angle est celui que forment dans R” les vecteurs 


A V1 
et 


après avoir centré (retranché E(X) et E(Y)), c’est-à-dire en se plaçant 
dans un repère de centre G(E(X); E(Y)). 


Il est évidemment hors de question de développer tout ceci le jour de 
l’Oral, mais avoir vu cette interprétation peut être enrichissant pour la 
discussion avec le jury! 
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Annexe 1 : tribu des boréliens 


Définition 9.27 Étant donné un ensemble {, on dit qu’une famille de 
parties de {1 est une tribu si elle contient l’ensemble vide, si elle est stable 
par passage au complémentaire et par union dénombrable. 


Une intersection de tribus est donc encore une tribu, ce qui permet de 
définir la tribu engendrée par une famille de parties de (1 : 


Définition 9.28 Soit À une famille de parties de (. On appelle tribu 
engendrée par À l'intersection de toutes les tribus qui contiennent À. On 
la note dans la suite T (A). 


Propriété 9.28 7 (A) est la plus petite tribu (au sens de l'inclusion) qui 
contient À. 


Démonstration : il est clair que 7 (.4) est une tribu et qu’elle contient 4. 
Si B est une tribu qui contient À, alors B contient 7 (4) (puisque 7 (4) 
est l'intersection des tribus contenant À). 


On considère le cas où = KR : 


Définition 9.29 On appelle tribu borélienne de R la tribu engendrée par 
l’ensemble O des ouverts de R, et on la note Br : Br = T(O). 
Les éléments de Br sont appelés les boréliens de R. 


La tribu BR contient en particulier les fermés de R (puisqu'elle est stable 
par passage au complémentaire) ; elle contient aussi les singletons (écrire 


1 1 
{a} = Nls- mat =), et comme elle est stable par union finie ou 


n>1 
dénombrable, elle contient les parties finies ou dénombrables de R, donc 


N, Z et Q sont des boréliens. Les intervalles sont aussi des boréliens 

([a; b[=]a; b[U{a}, [a; +oo[— LU la; n[), et on peut montrer qu’ils engendrent 
n>a 

Br. On peut se limiter aux intervalles du type Ja; b| : 


Propriété 9.29 Br est engendré par l’ensemble des intervalles ouverts 
Ix; y, x ER, yEeR. 


Démonstration : soit 7 la tribu engendrée par ces intervalles. Comme 
]x; y est un ouvert, on a immédiatement 7 C Br. 

On montre que Br C 7 : soit O un ouvert de R. On note B(x;r) la boule 
ouverte de centre x et de rayon r (dans le cas présent, c’est l'intervalle 
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Jz—r;x+r|, mais la démonstration est identique dans le cas de R”), et Q 
étant dénombrable, on note Q = {qn,m € N}. 
1 
=) co 
De plus, comme Q est dense dans R, il existe un entier m tel que 


Soit x € À. Comme O est ouvert, il existe un entier n tel que B (a 


FE — Qml or 


1 
On a donc B (am; a) C O, et O s'écrit alors comme une union dénom- 
brable de boules ouvertes : 


0=  U  E(mizn) 


(min)/B (amisrr) CO 


Tout ouvert O appartient donc à la tribu 7, et comme les ouverts en- 
gendrent Br, on à Br C 7. 


On peut démontrer ensuite qu’une probabilité y sur (R; Br) est entièrement 
déterminée dès qu’on la connaît sur un ensemble de parties qui engendre 
Br. u est donc déterminée par ses valeurs sur l’ensemble des intervalles 
] — æ;al,a € R, et donc la loi d’une variable aléatoire est entièrement 
caractérisée par la donnée de sa fonction de répartition, puisque F(x) = 


d(] — co; x]). 


Pour définir une probabilité sur R, on peut se demander pourquoi on ne 
prend pas comme tribu P(R) au lieu de BR : le problème est qu’il n’est pas 
possible de définir une application sur P(R) qui respecte les trois axiomes 
(additivité, totalité, positivité). Il faut une tribu plus petite : La tribu des 
boréliens convient. 


Remarque : il n’est pas très simple de montrer que Br est strictement 


incluse dans P(R). La construction de parties de R non boréliennes fait 
notamment appel à l’axiome du choix. 
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Annexe 2 : familles sommables 


On considère une famille (a;);er de réels. On veut donner un sens à Ÿ di : 
ieI 

si Î est une partie (infinie) de N, cette somme peut dépendre de l’ordre 

dans lequel on prend les à;, et si Z est un ensemble sur lequel on n’a pas 

d'ordre naturel (par exemple si Z est une partie de N° ou de Q), il n’y a 

pas de façon « canonique > de considérer des sommes partielles. 


Définition 9.30 Soit (a;);er une famille de réels positifs. On dit que cette 
famille est sommable si l’ensemble : 


{5 a;/J est une partie finie de I } 


ieJ 
est majoré. 
Si c'est le cas, la borne supérieure de cet ensemble est appelée somme de 
la famille (a )ier, et on la note ) Gi. 
iel 


Dans le cas où I est égal à N (ou à [no; +!) : 


Propriété 9.30 Soit (a:i);er une suite de réels positifs : la famille (a;)ser 
est sommable si et seulement si la série de terme général a; converge. 
On a dans ce cas : 


+00 
) Qi — > di 


il i=0 


On considère ensuite une famille (a;);er de réels quelconques. On pose, 
pour tout à € I, af = sup(a;;0) et a; = —inf(a;;0). Les éléments af et 
a; sont donc positifs et a; = aÿ — a; . 


Définition 9.31 1. La famille (a;);er est sommable si les familles (a* );ez 
et (a; );er sont sommables, et on pose dans ce cas : 


) Qi — > a) a; 
ieT iel ieT 


2. La famille (&);er est absolument sommable si la famille (|al)ier est 
sommable. 
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On a le résultat remarquable suivant : 


Propriété 9.31 La famille (a;);er est sommable si et seulement si elle est 
absolument sommable, et lorsque T = N, les trois propositions suivantes 
sont équivalentes : 


; La famille (a;)ien est sommable. 


ii La série ÿ a; est commutativement convergente, c’est-à-dire que pour 
i>0 
toute permutation o de N, la série D» Qo(i) CONVETJE. 
i>0 

in La série > a; est absolument convergente. 
i>0 

Si l’une de ces trois conditions est réalisée, alors, pour toute permutation 

o de N : 


+00 +00 

ÿ_ & — ÿ a — Ÿ Got) 

iEN i=0 i=0 
En probabilités, lorsque l’on considère une variable aléatoire discrète dont 
l'univers image X(() = {x;,i € I} est dénombrable, on veut définir 
l'espérance de X indépendamment de la bijection choisie entre X(Q) et 
N. On demande donc la sommabilité de la famille (x;p;)ier, et pas seule- 
ment la convergence de la série. 


Exemple 9.34 Soit X une variable aléatoire dont la loi est donnée par 


X(Q) = {(1)"(n+1),n € N°'} et, pour "7 € J P(X =n)=— nr D 
_1} 


convergente, l’espérance de X n'existe pas. On peut aussi dire que la famille 


La série de terme général nP(X = n) = n'étant pas absolument 


1} 1 
(CT n’est pas sommable puisque la famille (=) (c’est-à-dire 
nEN* N/n2>1 


n 
la famille des aÿ ) ne l’est pas. 
.…. (—1)" oi | 
Cependant, la série 3 mn — CONVETJE VETS —In2 (application classique 
n>1 

de la formule de Taylor avec reste intégral : développer x = In(1 + x) 
en ïo = 1). On pourrait donc vouloir poser E(X) = —In2, mais on a 
privilégié une bijection entre X (0) et N*. Si on définit 


N°  — X(Q) 
3k +  2k+1 
3k+1 + —-2(2k+1) 
3k+2 + —2(2k +2) 


O 
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c’est-à-dire la numérotation 1 H 2,2r5 -4,3+ 3, 4H —-6, 5 r —8, 
6 5, et c., on a alors la série : 


c’est-à-dire la série de terme général 


1 1 1 
2 (au: 1) 2@k+2)  2%+ ÿ 


k>1 


1 


Cette série est convergente, puisque son terme général est équivalent à 1 


mais elle a pour somme : 


= 1 1 1 ur À 1 1 
(55-25 mi _ Cr DE 


| | , In 2 
La variable aurait alors pour espérance Se ! 


Exemple 9.35 Soient p et q deux réels appartenant à ]0;1[. Considérons 
une variable aléatoire X dont la loi est donnée par X(Q) = N°, et, pour 
tout couple d’entiers (i;j), P(X = (i;j)) = (1 — q)q*(1 — p}p/. Soit I une 
partie finie de N°. Il existe deux entiers M et N tels que I C [0; MI x[0; N] 
et on a la majoration : 


M NN 
D ms <(-q{1-p)) D gp <1 
(i:j)eI i=0 j—0 


La famille est donc sommable, et sa somme vaut 1 : 


+oo +00 ” 
Sd my=(1-g){1-p) > S dp=1 
(er =0 j=0 
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